bioshokの最新AI事情 2026年5月2日~5月8日

  • URLをコピーしました!

偏執的に世界中のAI情報を収集・発信するbioshokの週刊連載。この1週間にピックアップした主要ニュースをまとめて紹介。

目次

【要約】

政策・ホワイトハウス ── 規制姿勢の揺れと米中対話の兆し
ホワイトハウスがAIセキュリティに関する大統領令を準備中だが、その内容を巡り二つの報道が交錯した。一方ではモデルの強制的なテストを省略しサイバー防御へのAI企業の自主的参加を重視する方向、他方では最先端AIモデルに対する国家安全保障リスク検証のための審査制度を含む規制強化の検討が伝えられている。ベッセント財務長官が「米国政府における我々の責務は安全の維持だ」と発言したことは、数か月前のトランプ政権高官のAIに対する姿勢からすれば大きな変化だ。

地政学面では、ワシントンと北京がAIに関する公式協議の開始を検討中と報じられた。AIモデルの予期せぬ挙動、自律型軍事システム、オープンソースツールを用いた非国家主体による攻撃といったリスクへの対処を念頭に、定期的な対話を目指している。

NYTにはDean Ball氏(トランプ政権側AI政策担当)とBen Buchanan氏(バイデン政権AI特別顧問)が超党派で連名寄稿し、米国政府はAIに対する危機感も制度も決定的に不足していると警鐘を鳴らした。Mythos級AIが電力網・病院・銀行など重要インフラの脆弱性を大量発見しうること、GPT-5.4が博士レベルのウイルス学者を上回る実験支援能力を持つこと、中国がAIを軍事・諜報優位に使う野心を持つことなどを挙げ、チップ輸出規制の強化、AI企業の安全性主張に対する独立監査、破局的リスクにおける米中協調、そして超党派での即時行動を求めている。

Mythos ── ベンチマーク分析とアクセス拡大
Mythosの能力について新たな分析が出ている。50%タイムホライゾンで飽和の兆候が見られるものの、80%タイムホライゾンでは2024年以降の推論モデルの指数トレンドに乗っている可能性がある。年末にはこれがAI2027が予測するような超指数関数的軌道に入っているかが判明するだろう。

コスト面ではGPT-5.5との差が注目される。英国AISIのTLOベンチマークでGPT-5.5はMythosとほぼ同等かわずかに上回るパフォーマンスを示す一方、試行コストはGPT-5.5が約500ドルに対しMythosは約2,600ドルと約5倍の開きがある。

Anthropic ── SpaceXとの提携と研究自動化の展望
AnthropicがSpaceXとのパートナーシップに合意し、コンピューティング能力を大幅に拡充。Claude CodeとClaude APIの利用制限引き上げが可能になった。さらに数ギガワット規模の軌道上AIコンピューティング能力の開発にも関心を示しており、宇宙空間でのAI計算基盤構築が現実味を帯びてきた。Anthropic共同創設者のJack Clark氏は、2028年末までに自動化されたAI研究開発が実現する可能性を約60%、2027年末までなら30%と見積もっている。

OpenAI ── GPT-5.5のコスト優位性とCoT事故の開示
OpenAIは、RL(強化学習)中に思考連鎖(CoT)を直接採点しないという方針を持っていたにもかかわらず、一部の訓練実行で誤ってCoTが報酬計算に含まれていたことを発見・開示した。現時点の分析ではCoTの監視可能性が大きく劣化した明確な証拠は見つかっていないが、今後もCoT採点は避けるべきとの結論を示している。透明性の観点では評価できる開示だ。

安全性・アライメント研究
ベンジオ氏の「Scientist AI」構想に進展があった。通常のLLMのように「人間が言いそうなトークン」を予測するのではなく、自然言語の命題について「それが真である確率」を出力するよう訓練する非エージェント的アプローチで、訓練データをcommunication acts(誰かがXと言った)とfactual syntax(数学的証明、コード実行結果、科学的測定など)に分離する。ベンジオ氏は直近8か月の数学的作業により、このアーキテクチャには一定の安全保証を与えられそうだとして、以前より楽観的になっているという。

経済・成長理論
NBER論文が、AI研究の自動化による経済成長の特異点到達条件を分析した。AIソフトウェア、チップ研究、計算資源、GDP、研究投資のフィードバックがアイデア発見の収穫逓減を上回ると、モデル上は有限時間で成長率が発散する。特にハードウェア研究の自動化が効き、全体13%程度の自動化で爆発条件に到達、ソフトウェア研究100%と他部門5%の自動化で約6年で成長率が発散するという。また産業爆発(ロボットがロボットを作る連鎖)の速度に関する分析では、現在の物理技術レベルで約1年での倍増が現実的との結論が示された。

ロボティクス
Figureが2体のヒューマノイドロボットが共有プランナーもメッセージ交換もなしに、互いに目配せしながら協力して部屋を片付けベッドメイキングするデモを公開した。end-to-endでの協働デモとしては恐らく初の事例だ。

---

全体として、トランプ・バイデン両政権のAI政策担当者が連名で危機感を表明し、米中AI対話の検討が始まり、ベッセント財務長官が「安全の維持」を明言するなど、AI安全保障が党派を超えた国家課題として認識され始めた一週間でした。AnthropicのSpaceX提携やベンジオ氏のScientist AI構想、NBER論文による経済特異点の分析など、技術・理論の両面でもAGI後の世界を見据えた動きが加速しています。

【詳細】

  • ホワイトハウスは、AIセキュリティに関する大統領令を準備しており、その内容はモデルの強制的なテストを省略し、サイバー防御へのAI企業の自主的な参加を重視するものである。大統領令で規制強化にはならなかったようだ。
    https://x.com/i/status/2052959941569528061
  • ホワイトハウス、高度なAIに対する規制強化を検討。トランプ政権は、国家安全保障上のリスクを検証するための審査制度を含め、最先端のAIモデルに関する一連の新たな大統領令について協議している。
    https://x.com/i/status/2052066733129924779
  • Mythosが50%タイムホライゾンで飽和。少なくとも16時間だが、80%タイムホライゾンでは推論モデルの指数トレンド(2024?)に載っているようにも思える。年末にはこれがAI2027のような超指数関数になっているかがわかると思う。AI Futures modelの中央推定は現状若干超えている。
    https://x.com/i/status/2052957675630252171
  • ベンジオ氏のScientist AI(非エージェント的な予測器)構想が発展したらしく、アライメントに楽観的で、数学的に悪い振る舞いが起きにくいと保証できたと言っている(今後公開予定)。
    普通のLLMのように「次に人間が言いそうなトークン」や「人間が高評価しそうな返答」を予測するのではなく、自然言語で書かれた命題について 「それが真である確率」 を出すように訓練する。ポイントは、訓練データを2種類に分けること。「誰かがXと言った」という communication acts。もう一つは、数学的証明、コード実行結果、科学的測定など、より強く事実と見なせる factual / hypothesis syntax。モデルは「多くの人がそう言っているから真」と学ぶのではなく、「なぜその人々がそう言ったのか」を説明する世界モデルを作ることを目指す。ベンジオ氏は、直近8か月ほどの数学的作業で、この非エージェント的なScientist AIには一定の安全保証を与えられそうだとして、以前より楽観的になっているらしい。
    https://x.com/i/status/2052774508319445169
  • Figureの2体のヒューマノイドがお互い目配せしながら協力して部屋を片付け、ベッドメイキングするデモ。ロボット間に共有プランナーも、メッセージのやり取りもなく、end2endに協働するデモは恐らく初。
    https://x.com/i/status/2052770982214172892
  • 現在の物理技術レベルで、産業爆発(ロボットがロボットを作る…)はどれくらい速く起こり得るか? Damon Binder からの新しい投稿では、結論として約1年での倍増時間が現実的そうだ。
    https://x.com/i/status/2051706262753014056
  • OpenAIが「RL中にCoT=思考過程を直接採点しない」という方針を持っていたにもかかわらず、一部の訓練実行で誤ってCoTが報酬計算に入っていたことを発見。結論としては、限定的な事故はあったが、現時点の分析ではCoTの監視可能性が大きく劣化した明確な証拠は見つからなかった。ただし今後もCoT採点は避けるべきとの結論。
    https://x.com/i/status/2052451995467018427
  • 「米国政府における我々の責務は安全の維持だ」とベセント氏は語る。「我々は安全が確保されるよう尽力する」。
    ほんの数か月前を振り返ってみると、トランプ政権の高官がAIについてこのような言葉を口にするなど、想像もできなかっただろう。
    https://x.com/i/status/2052027079932146077
  • ワシントンと北京は人工知能(AI)に関する公式協議の開始を検討。双方が念頭に置いているのは、AIモデルの予期せぬ挙動、自律型軍事システム、あるいは強力なオープンソースツールを用いた非国家主体による攻撃によってもたらされるリスクに対処するための、定期的な対話である。
    https://x.com/i/status/2052199406959808528
  • アンソロピックはSpaceXとのパートナーシップに合意し、コンピューティング能力が大幅に向上。この提携に加え、最近締結した他のコンピューティング関連の契約により、Claude CodeとClaude APIの利用制限を引き上げることが可能に。
    ・この合意の一環として、SpaceX社と提携し、数ギガワット規模の軌道上AIコンピューティング能力を開発することにも関心を示している。
    https://x.com/i/status/2052065912447238415
  • AI研究の自動化で、経済成長は特異点を迎えるのか? というNBER論文。AIソフトウェア、チップ研究、計算資源、GDP、研究投資のフィードバックが、アイデア発見の収穫逓減を上回ると、モデル上は有限時間発散が起こる。特に効くのはハードウェア研究の自動化。全体13%程度の自動化で爆発条件に到達し、ソフトウェア研究100%+他部門5%自動化なら約6年で成長率が発散する。
    https://x.com/i/status/2051753623470633176
  • GPT-5.5がMythosよりも約4~5倍安価だとは、これまで気づきませんでした。Natalia Coelho氏による、公開情報に基づいたMythosの性能に関する優れた分析(引用ツイートにリンクあり)には、英国AISIのTLOベンチマークにおける両モデルのパフォーマンスに関する以下のグラフが含まれています。GPT-5.5がこのベンチマークで平均的にMythosよりもわずかに優れたパフォーマンスを発揮することは既に知られていましたが(ただし、GPT-5.5は10回の試行のうち2回しか成功せず、Mythosは3回成功)、GPT-5.5の試行コストが平均約500ドルであるのに対し、Mythosは約2,600ドルもかかるという事実は、私にとって驚きでした。
    https://x.com/i/status/2051748442918297792
  • Anthropic共同創設者Jack Clark氏は2028年末までに自動化されたAI研究開発が実現する可能性は約60%で、2027年末までに30%と考えているようだ。
    https://x.com/i/status/2051343176204722277
  • NYTにDean Ball(トランプ政権側のAI政策担当者)とBen Buchanan(バイデン政権のAI特別顧問)が連名で米国政府はAIに全然目覚めておらず、危機感が足りないと寄稿。AIはサイバー、バイオ、軍事、対中競争のすべてに関わる国家安全保障技術で、米国はAI開発を進めつつ、中国への先端計算資源流出を止め、企業の安全性主張を独立監査し、破局的リスクでは中国とも協調する必要があるが現状のワシントンには危機感も制度も足りないと記事。
    • Mythos級AIは重要ソフトウェアの脆弱性を大量発見し、電力網・病院・銀行など重要インフラ攻撃に使われ得る
    • GPT-5.4は博士レベルのウイルス学者を上回る実験支援能力を持つとされ、バイオリスクも深刻化
    • AIは材料科学、ソフトウェア、産業プロセス、兵器開発にも効く
    • 中国はAIを軍事・諜報優位に使う野心を持つ
    • 米国は計算資源で中国に大きく先行しているが、チップ輸出規制・密輸対策・海外クラウド利用の抜け道封じが必要
    • 同時に、AIバイオ兵器のような破局的リスクでは中国とも協力すべき
    • AI企業の安全性主張には、政府監督下の独立監査が必要
    • AIに関する超党派協力は戦略的に不可欠で両党の議員は、早速行動を起こすべき
      https://x.com/i/status/2051314472770507228
よかったらシェアお願いします
  • URLをコピーしました!

この記事を書いた人

bioshokのアバター bioshok リサーチフェロー

大学では半導体に関する研究をし、大学院では自然言語処理に関する研究を行う。
Xの @bioshok3 にてAIに関するトレンドとAIがもたらす深刻なリスクに関して発信している。

メールマガジン「週刊UNVEIL」(無料)をご購読ください。毎週、新着情報をお届けします。

目次