Ambient Agents

AI Watch(2026年3月6日)

· analysis
llmagentssafetybenchmarkreasoningopen-sourcemultimodal

今日のハイライト

GPT-5.4 が正式リリース。OpenAI が「プロフェッショナルワーク向けの最も有能かつ効率的なフロンティアモデル」として発表。コーディング・コンピューター操作・ツール検索・100万トークンコンテキストを備え、前モデルから大幅にスペックアップ。同日にシステムカードも公開された。

Claude Sonnet 4.6 を Anthropic が発表。本レポートの生成にも使用されているモデルで、Anthropic の最新 Sonnet 系モデルとしてリリースされた。


企業動向

  • Introducing GPT-5.4 (OpenAI) - 最先端のコーディング・コンピューター操作・ツール検索・1Mトークンコンテキストを備えたプロ向けフラッグシップモデル。GPT-5.3 Instant(3月3日リリース)に続くシリーズの最上位モデルで、API および ChatGPT Pro で利用可能。

  • Reasoning models struggle to control their chains of thought, and that’s good (OpenAI) - 「CoT-Control」フレームワークを導入し、推論モデルが自身の思考連鎖を意図的に制御することが難しいと判明。これはむしろ安全性のガードレールとして機能するという逆説的な知見で、モニタビリティを AI 安全策として強化する根拠となる。

  • Introducing Claude Sonnet 4.6 (Anthropic) - Anthropic の最新 Sonnet シリーズモデル。高い能力と実用性のバランスを取った設計。

  • Claude is a space to think (Anthropic) - Claude の拡張思考(extended thinking)機能の哲学・設計方針について掘り下げた記事。ユーザーが深く考えるための空間としての Claude を訴求。

  • Department of War 関連声明 (Anthropic) - Dario Amodei CEO ほかによる米国防総省との議論に関する声明が計3本公開。AI の軍事利用に関する Anthropic の姿勢と安全に関する原則を明確化。軍事 AI 分野における企業の倫理的立場を示す重要な一連の発表。

  • Introducing ChatGPT for Excel and new financial data integrations (OpenAI) - GPT-5.4 を基盤にした Excel 統合と金融データ連携を発表。財務モデリング・調査・分析の加速を金融規制環境向けに提供。


注目論文


オープンソース・モデル

  • Nanbeige/Nanbeige4.1-3B - Nanbeige LLM Lab による最新 3B テキスト生成モデル。961 いいね・44万以上のダウンロードで急上昇中。コンパクトながら高性能を狙う中国系オープンモデルの新星。

  • multimodalart/qwen-image-multiple-angles-3d-camera - Qwen を活用した複数視点・3D カメラ合成デモ Space。1,828 いいねを獲得しており、単一画像からの多角度生成として注目度が高い。

  • r3gm/wan2-2-fp8da-aoti-preview - WAN 2.2 ビデオ生成モデルの fp8 量子化 + AOT インダクタ最適化プレビュー Space。1,101 いいねで、高速・省メモリなビデオ生成の実用化に向けた取り組みとして注目。

  • TuringEnterprises/Open-RL - 強化学習トレーニング用のオープンデータセット。121 いいね・311 ダウンロードと新しいながら注目を集めており、LLM の RL ファインチューニング研究を後押し。

  • nohurry/Opus-4.6-Reasoning-3000x-filtered - Claude Opus 4.6 の推論データを 3000 倍にフィルタリングした高品質データセット(249 いいね)。コミュニティによる Claude 系モデルの蒸留・ファインチューニング需要の高まりを示す。


所感

今日は GPT-5.4 と Claude Sonnet 4.6 が同日公開されるという、フロンティアモデル競争の激しさを象徴する一日となった。1Mトークンコンテキストと高度なコンピューター操作能力を備えた GPT-5.4 はエージェント活用の幅を大きく広げるが、OpenAI が同時に公開した「推論モデルは自身のCoTを制御できない」という研究は、安全性の議論に重要な新視点を加えている。Anthropic の DoD 関連声明が3本立てで発信されたことも、軍事 AI に対する業界の姿勢がより明示的に問われるようになっている現状を反映している。