AI Watch（2026年3月6日）

2026-03-06 15:00 JST · analysis

llmagentssafetybenchmarkreasoningopen-sourcemultimodal

今日のハイライト

GPT-5.4 が正式リリース。OpenAI が「プロフェッショナルワーク向けの最も有能かつ効率的なフロンティアモデル」として発表。コーディング・コンピューター操作・ツール検索・100万トークンコンテキストを備え、前モデルから大幅にスペックアップ。同日にシステムカードも公開された。

Claude Sonnet 4.6 を Anthropic が発表。本レポートの生成にも使用されているモデルで、Anthropic の最新 Sonnet 系モデルとしてリリースされた。

企業動向

Introducing GPT-5.4 (OpenAI) - 最先端のコーディング・コンピューター操作・ツール検索・1Mトークンコンテキストを備えたプロ向けフラッグシップモデル。GPT-5.3 Instant（3月3日リリース）に続くシリーズの最上位モデルで、API および ChatGPT Pro で利用可能。
Reasoning models struggle to control their chains of thought, and that’s good (OpenAI) - 「CoT-Control」フレームワークを導入し、推論モデルが自身の思考連鎖を意図的に制御することが難しいと判明。これはむしろ安全性のガードレールとして機能するという逆説的な知見で、モニタビリティを AI 安全策として強化する根拠となる。
Introducing Claude Sonnet 4.6 (Anthropic) - Anthropic の最新 Sonnet シリーズモデル。高い能力と実用性のバランスを取った設計。
Claude is a space to think (Anthropic) - Claude の拡張思考（extended thinking）機能の哲学・設計方針について掘り下げた記事。ユーザーが深く考えるための空間としての Claude を訴求。
Department of War 関連声明 (Anthropic) - Dario Amodei CEO ほかによる米国防総省との議論に関する声明が計3本公開。AI の軍事利用に関する Anthropic の姿勢と安全に関する原則を明確化。軍事 AI 分野における企業の倫理的立場を示す重要な一連の発表。
Introducing ChatGPT for Excel and new financial data integrations (OpenAI) - GPT-5.4 を基盤にした Excel 統合と金融データ連携を発表。財務モデリング・調査・分析の加速を金融規制環境向けに提供。

注目論文

MAGE: Meta-Reinforcement Learning for Language Agents toward Strategic Exploration and Exploitation (Yang et al.) - 非定常環境に適応できない従来の LLM エージェントの課題に対し、メタ強化学習で戦略的な探索と活用のバランスを学習させる手法を提案。エージェントの汎化能力を大幅に向上させる。
LifeBench: A Benchmark for Long-Horizon Multi-Source Memory (Cheng et al.) - パーソナライズドエージェントの長期記憶能力を評価する新ベンチマーク。複数情報源にわたる長期記憶・推論・時間適応を包括的に測定し、既存メモリ研究のギャップを埋める。
SE-Search: Self-Evolving Search Agent via Memory and Dense Reward (Li et al.) - RAG の限界を超えるために、メモリと密な報酬信号を組み合わせた自己進化型検索エージェントを提案。検索精度と事実整合性を継続的に改善する仕組みが特徴。
TTSR: Test-Time Self-Reflection for Continual Reasoning Improvement (He et al.) - テスト時訓練（Test-Time Training）を応用し、テスト問題のみを使って推論能力を継続的に向上させる手法。追加の学習データなしにモデルの推論を自律改善できる点が新しい。
How LLMs Cite and Why It Matters: A Cross-Model Audit of Reference Fabrication in AI-Assisted Academic Writing (Naser) - 複数の LLM にわたる学術引用捏造（ハルシネーション）を大規模に監査。プロバイダー・ドメイン・プロンプト手法によって引用の信頼性がどう変わるかを分析し、AI 支援の学術執筆に対する警鐘を鳴らす。

オープンソース・モデル

Nanbeige/Nanbeige4.1-3B - Nanbeige LLM Lab による最新 3B テキスト生成モデル。961 いいね・44万以上のダウンロードで急上昇中。コンパクトながら高性能を狙う中国系オープンモデルの新星。
multimodalart/qwen-image-multiple-angles-3d-camera - Qwen を活用した複数視点・3D カメラ合成デモ Space。1,828 いいねを獲得しており、単一画像からの多角度生成として注目度が高い。
r3gm/wan2-2-fp8da-aoti-preview - WAN 2.2 ビデオ生成モデルの fp8 量子化 + AOT インダクタ最適化プレビュー Space。1,101 いいねで、高速・省メモリなビデオ生成の実用化に向けた取り組みとして注目。
TuringEnterprises/Open-RL - 強化学習トレーニング用のオープンデータセット。121 いいね・311 ダウンロードと新しいながら注目を集めており、LLM の RL ファインチューニング研究を後押し。
nohurry/Opus-4.6-Reasoning-3000x-filtered - Claude Opus 4.6 の推論データを 3000 倍にフィルタリングした高品質データセット（249 いいね）。コミュニティによる Claude 系モデルの蒸留・ファインチューニング需要の高まりを示す。

所感

今日は GPT-5.4 と Claude Sonnet 4.6 が同日公開されるという、フロンティアモデル競争の激しさを象徴する一日となった。1Mトークンコンテキストと高度なコンピューター操作能力を備えた GPT-5.4 はエージェント活用の幅を大きく広げるが、OpenAI が同時に公開した「推論モデルは自身のCoTを制御できない」という研究は、安全性の議論に重要な新視点を加えている。Anthropic の DoD 関連声明が3本立てで発信されたことも、軍事 AI に対する業界の姿勢がより明示的に問われるようになっている現状を反映している。

Ask Claude