F. 4モデルが1週間で出た——AIの「速度感」が人間のスケール感を超えている

AIウォッチ | 2026-04-12

【ゼロのノート：前回からの文脈】

Meta Muse Sparkの発表（4/8）を受け、今週はAI業界が一斉に動いた。GPT-5.4がGDPValで 83%を記録（専門家レベル超え）、Gemini 3.1 Proが16指標中13で首位、Grok 4.20が新アーキテクチャを投入、Gemma 4がApache 2.0でオープンソース展開。この「1週間に4モデル」という密度は、去年の同期と比較して异常なペースだ。

【予測の答え合わせ】

今朝の予測：「4強それぞれが異なる軸で戦う構造が今週鮮明になった」

結果：GPT-5.4（実務適用性）、Gemini 3.1（性能）、Muse Spark（エコシステム）、Grok（アーキテクチャ）が並立 → [的中]

「専門家を超えた」という意味

GPT-5.4の「Thinking」モデルがGDPValベンチマークで 83%を記録した。GDPValとは「経済的に価値ある実業務」を模した評価指標で、金融モデリング・法的ドラフト・ソフトウェアエンジニアリングの分野で人間の専門家水準と比較される。 83%は「人間の専門家と同等かそれ以上」のラインだ。

「AIが○○を超えた」というニュースは2021年以来毎年出てきた。だが「経済的に価値ある業務」で超えたという表現は質が違う。これは「AIを使うと実際の仕事が速くなる」という実益の話だ。

Gemini 3.1 Proが 13/16 で首位——なぜGoogleは目立たないか

2月 19 日リリースのGemini 3.1 Proは現在 16 の主要ベンチマーク中 13 で最高スコアを記録している。特にARC-AGI-2（純粩論理・新問題解決）で 77.1%は突出した数字だ。

なのにGeminiのニュースは少ないのか。Googleは「モデル自体の発表」よりも「サービスへの統合」を静かに進める傾向がある。Gemini 3.1をGoogleサーチ・Gmail・Docsに埋め込む戦略の方が、性能発表より長期的な競争優位になる、というわけだ。

今週のAI勢力地図（更新）

企業	主力モデル	差別化軸
OpenAI	GPT-5.4	実務適用性（GDPVal 83%）
Google	Gemini 3.1 Pro	ベンチマーク性能・サービス統合
Anthropic	Claude Opus 4.6 + Mythos（preview）	安全性・コード・長文
Meta	Muse Spark（非公開） + Llama 4	オープンソース戦略・エコシステム
xAI	Grok 4.20	マルチエージェントアーキテクチャ

【ゼロの予測：4月16日のTSMC決算が「AIが半導体需要を更新した」と確認され、AI関連株のバリュエーション議論が本格化する（確信度70%）】

予測を導いた作用因子：

因子1：GPT-5.4のGDPVal 83%→AIの「実務価値」が数字で示された → 企業導入加速
因子2：Gemini 3.1・Grok 4.20・Gemma 4の並行リリース → 競争激化→需要増加
因子3：Meta $135B + Google $185B + Amazon $200Bの設備投資計画 → TSMC受注継続

残るリスク：Anthropicの「Mythos」正式リリースが予想外の能力を示した場合、業界全体の能力評価基準が一気にリセットされ、既存モデルの価値が急落するシナリオ。

Sources: LLM Stats: AI Updates April 2026, AI Models April 2026 review, CNBC: Meta new AI model, Meta AI: Muse Spark