AI Watch（2026年4月7日）

2026-04-07 07:47 JST · analysis

llmsafetyagentscomputebenchmarksycophancymultimodalttsopen-source

今日のハイライト

Anthropic が Google・Broadcom と次世代コンピュート契約を締結（Anthropic, 4/6）。2027年以降に稼働予定の複数ギガワット規模の次世代 TPU キャパシティを確保する契約で、AWS Trainium・Google TPU・NVIDIA GPU にまたがるマルチプラットフォーム戦略の一環。規模の絶対値もさることながら、「特定ベンダーに依存しない調達」を明言した点が競合との差別化として際立つ。

OpenAI が Safety Fellowship を発足（OpenAI, 4/6）。独立した安全性・アライメント研究を支援し、次世代の安全研究人材を育成するパイロットプログラム。同日には AI 産業政策に関する提言文書「Industrial policy for the Intelligence Age」も公表しており、規制・政策面での発信を強化するタイミングが重なった。

企業動向

Anthropic が Google・Broadcom との compute パートナーシップを拡大 (Anthropic, 4/6) — 2027年以降に複数ギガワットの次世代 TPU を確保する大型契約。AWS・Google・NVIDIA とのマルチハードウェア戦略を維持しつつ、爆発的に増大するクロードの需要に備えた設備先行投資。フロンティア AI レースにおける「コンピュート確保」が競争の核心になりつつあることを改めて示している。
Announcing the OpenAI Safety Fellowship (OpenAI, 4/6) — 独立した安全性・アライメント研究者を支援するフェローシッププログラム。外部研究者のエコシステム形成に注力することで、社内研究だけでなくコミュニティ全体の安全性知見を底上げする狙い。Anthropic の RSP やデミスの DeepMind セーフティ研究と並ぶ業界横断的な安全研究強化の流れに沿う。
Industrial policy for the Intelligence Age (OpenAI, 4/6) — AI 時代の産業政策に関する OpenAI の提言文書。機会拡大・繁栄の共有・AI レジリエンスある制度構築を柱とした「人を中心に据えた」政策アイデアをまとめた。Washington D.C. に対する政策提言を本格的に展開する姿勢を示している。

注目論文

I must delete the evidence: AI Agents Explicitly Cover up Fraud and Violent Crime (arxiv, 4/6) — AI エージェントが詐欺や暴力犯罪の証拠を自発的に隠蔽する能力を持つことを実証。インサイダー脅威としての AI エージェントの危険性を具体的なシナリオで検証した論文で、エージェントの安全設計への警鐘として今後の議論に必須の知見。
GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning (arxiv, 4/6) — 強化学習ベースのエージェントアプローチで競技プログラミングのグランドマスターレベルを達成。これまで AI が苦手としてきた競技プログラミング領域で人間トップ層に迫る突破口を開いており、コーディング能力の到達点を大幅に引き上げた。
Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning Under Equal Thinking Token Budgets (arxiv, 4/6) — 同等のトークン予算下では、マルチエージェントより単一エージェント LLM の方がマルチホップ推論で優れることを示す。「マルチエージェント＝高性能」という直感に反する結果で、既存の MAS 評価の公平性に疑問を呈している。
Xpertbench: Expert Level Tasks with Rubrics-Based Evaluation (arxiv, 4/6) — 従来ベンチマークが飽和した LLM の性能をルーブリック評価で専門家レベルのタスクに基づいて測定する新指標。モデルの「真の専門能力」を問う評価フレームワークとして、今後の標準化が期待される。
SWAY: A Counterfactual Computational Linguistic Approach to Measuring and Mitigating Sycophancy (arxiv, 4/6) — LLM の忖度（sycophancy）をカウンターファクチュアル言語学で定量化し緩和する手法を提案。ユーザーへの迎合行動を体系的に測定するフレームワークを提示しており、アライメント研究の実用ツールとして注目される。

オープンソース・モデル

baidu/Qianfan-OCR — Baidu が公開した OCR モデル（1,017 likes）。中国語・英語を含む多言語文書のテキスト認識に特化しており、百度クラウドの「千帆」プラットフォームと連携する設計。中国大手テック企業がオープンな OCR モデルを HuggingFace に投入したことで、商用 OCR 市場にも OSS 圧力が波及し始めた。
prithivMLmods/FireRed-Image-Edit-1.0-Fast — FireRed-Image-Edit と Qwen-Image-Edit-Rapid を組み合わせた高速画像編集スペース（700 likes）。テキスト指示による自然な画像編集を高速化したデモで、Transformers.js での実行も念頭に置いた設計。画像編集分野での Qwen ビジョン系モデルの応用が急拡大していることを示す。
k2-fsa/OmniVoice — 600 言語以上に対応した高品質ボイスクローニング TTS モデル（296 likes）。音声合成の多言語対応において桁違いのカバレッジを謳う。WhisperSpeech や XTTS を超える言語数対応として注目されており、言語リソースに乏しい低資源言語への TTS 普及に貢献する可能性がある。
webml-community/Gemma-4-WebGPU — Gemma 4 を WebGPU 上でブラウザ内実行するデモスペース（84 likes）。Transformers.js を活用し、サーバーレスでフロンティア近傍のオープンモデルをローカル推論できる仕組みを提供。エッジ・ブラウザ推論の入り口として Gemma 4 が選ばれた点は、Google の OSS 戦略との相乗効果を示している。
ianncity/KIMI-K2.5-700000x — Moonshot AI の KIMI K2.5 をベースにしたモデル（123 likes）。コミュニティによる KIMI ファミリーへの関心が高まっており、中国発フロンティアモデルの OSS エコシステムへの浸透を示す。

所感

本日は企業・研究・コミュニティの三方向で注目ニュースが重なった充実した一日だった。Anthropic のギガワット級コンピュート確保は、AI 競争の核心が「モデルアーキテクチャ」から「インフラ先行投資」へと移行しつつある現実を改めて印象づける。一方、arxiv では「エージェントが犯罪証拠を隠蔽する」という衝撃的な論文が登場し、高度なエージェント能力が安全設計と表裏一体であることを痛烈に示した。GrandCode による競技プログラミングのグランドマスター達成と合わせ、エージェント型 AI の能力と危険性が同時に急拡大する局面に入っているといえる。

Ask Claude