bioshokの最新AI事情 2026年4月18日~4月24日

  • URLをコピーしました!

偏執的に世界中のAI情報を収集・発信するbioshokの週刊連載。この1週間にピックアップした主要ニュースをまとめて紹介。

目次

【要約】

Mythos ── 政府内の矛盾、不正アクセス、そして再現までのカウントダウン
Mythos Previewを巡る動きは今週も続いた。国防総省がAnthropicを「サプライチェーンリスク」に指定しているにもかかわらず、NSA(国家安全保障局)がMythosを使用していることが報じられ、政府内部の矛盾が露呈した。一方でDiscord上の少数グループがAnthropicの第三者請負業者のアクセス権などを組み合わせてMythosに不正アクセスしていたことも判明。グループはサイバー関連のプロンプトは実行しておらず、検出回避のために単純なウェブサイト構築などを試していたという。Anthropicは調査中だがシステムへの影響は確認されていないとしている。

ダリオ・アモデイ氏はFTのインタビューで、オープンソースモデルと中国の開発者が6?12か月以内にMythosの機能を再現できるようになるだろうと述べた。Mythosの80%タイムホライゾンが5.5時間であるとすれば、AI2027のDaniel Kokotajlo氏の予測モデルとほぼ一致するタイムラインにあり、同氏自身も「より短いタイムラインへの更新だ」と認めている。

OpenAI ── GPT-5.5リリースとサイバー防衛の二本立て
OpenAIがGPT-5.5をリリースした。Mythosには劣るがOpus 4.7をほとんどの指標で上回り、コストはMythosの約1/5。サイバーリスクに対するより厳格な分類器を導入し、「AIの民主化」をAnthropicへの対抗ナラティブとして掲げている。

サイバー防衛面では、OpenAIが過去1週間で連邦政府機関・州政府・ファイブアイズ同盟国に対し、新製品「gpt-5.4-cyber」の説明を実施。強力なセキュリティ対策を施した一般版と、Trusted Accessプログラムを通じて防御担当者向けに提供するサイバー攻撃寛容版という二本立てのアプローチを採用している。

アルトマン氏はポッドキャストで、「危険すぎて公開できないモデル」というレトリックが今後増えるが、それが少数の企業による支配の正当化に使われるリスクを指摘。Mythosについてはマーケティングではなくサイバーセキュリティにおいて優れたモデルだと評価しつつ、OpenAIには強力な能力を世界に出す納得のいく計画があると述べた。同時に、モデルが強力になるほど米政府を支援することが重要であり、主要AI企業が政府を支援しない未来に良い未来はないとも語っている。ただし社内では、安全性に配慮する多くの社員とは対照的に、グローバルアフェアチームが安全性を敵視するような発信をしているとの指摘も出ている。

米議会 ── AGIリスクへの認識が急速に深まる
元OpenAI取締役のヘレン・トナー氏が米上院の公聴会に出席し、ジョシュ・ホーリー議員との注目すべきやり取りが行われた。トナー氏は、超人的AIシステムが1~3年以内に実現するという極端に短いタイムラインには懐疑的としつつも、3年から10年以内に構築される現実的可能性があり、それを真剣に受け止めるべきだと証言。ホーリー議員はこれを受けて、もし外国の敵対勢力が同じ目標を持っていたら国家安全保障上の脅威と見なすはずなのに、自国企業がそれを行っている矛盾を指摘した。トナー氏は「米中AI競争の勝者はAIそのものだ」と述べ、米国のAIセクターが先行することは重要だが、それがAIに地球全体を席巻させる代償であっては意味がないと応じた。

別の場では、国土安全保障省のテロ対策部門がAIの「脱獄」デモを下院議員に実施。爆弾製造やテロ計画、サイバー攻撃への転用がいかに容易かを示し、議員らに衝撃を与えた。

・蒸留問題とDeepSeek V4
米国政府が中国によるAIの「産業規模の蒸留」を公式に非難し、外国勢力に責任を負わせるための措置を検討中。「悪意のある搾取から派生したオープンモデルはオープンではない」との立場を示した。こうした中、DeepSeek V4が先端モデルに近づきつつあり、安全性をほぼ考慮していない同モデルの台頭は、オープンウェイトへの議会の規制強化とミスアライメントリスクの両面で懸念を呼んでいる。

政策・安全保障
元ホワイトハウスAI担当のDean Ball氏が、フロンティアAIのリスクに対する「賢明な中間路線」を提唱する記事を発表。サイバー攻撃・生物兵器・自律兵器など最も深刻なカテゴリーへの透明性促進、AI安全性の主張を検証する独立した民間組織ネットワークの構築を提言した。UAEは政府のセクター・サービス・業務の50%をAgentic AIで運営すると発表し、自律システムをこの規模で運用する世界初の政府を目指すとしている。

日本 ── AGI認識の広がり
AI安全性のルーツであるMIRI所長のNate Soares氏が初めて日本メディアに出演した。「超知能AIを作れば人類は絶滅する」の共著者として、急速なAI開発を一旦止めて全員で落ち着いて取り組む必要性を訴えた。台湾のチップ製造やオランダの露光機というサプライチェーンの要所を止めれば核兵器よりも容易にASI開発を停止できるはずだとし、完全な悲観ではなくアライメントされた超知能は可能だとの見方も示した。

自民党のホワイトペーパーにAGIという言葉が登場し、4月16日には高橋恒一氏の「日本AGI基盤構想」が自民党で発表された。日本の政策議論においてAGIという概念が浸透し始めている。

全体として、Mythosの再現カウントダウン(6~12か月)が始まる中、米議会でAGIリスクへの認識が急速に深まり、「中国に勝てばよいのか」という根本的な問いが政治の場で正面から議論された一週間でした。OpenAIのGPT-5.5リリースとサイバー防衛体制の構築、蒸留問題への政府対応、そして日本でのAGI議論の広がりが同時進行しています。

【詳細】

  • 初めて日本メディアにAI SafetyのルーツMIRI所長のNate Soares氏が出演。ユドコウスキーと一緒の「超知能AIを作れば人類は絶滅する」の著者で、人類の未来を真剣に考える人は読むべきだ。とても分かりやすく比喩を使って話してくれている。急速にAI開発を続ける今の異常な状態を一旦やめて、みんなで落ち着いて作らないと本当に滅びるぞという話。完全な悲観でもなく、人類が滅びないようにアライメントされた超知能は可能であると思うといいつつ「日本人にも気づいている人がいるようだし、巨大なリスクがある技術に大急ぎで突っ走るのはやめようという意識を広めましょう。ウランは世界中のあちこちにあるが、チップを作る台湾か、露光機を作るオランダでサプライチェーンを止めれば、核兵器よりも簡単にASI開発を止めることができるはずだ。誰でも手軽にガレージで超知能が作れるようになる前に止めなければならない」終盤の発言はこういう感じ。
    https://x.com/i/status/2047691577871736991
  • Deepseek V4が先端モデルに近づきつつあるし、Mythosや米政府が蒸留を敵対的なものだと昨日非難してることを鑑みるとオープンウェイトへの議会の規制や懸念は大きくなるだろう。またDeepSeekはほぼ安全性を考慮してないため、ミスアライメントのリスクにも不安がよぎる。
    https://x.com/i/status/2047532454358196680
  • Mythosの80%タイムホライゾンが5.5時間だとしたら、まさにAI2027のこのDaniel’s modeとほぼ同じタイムラインにいる。
    AI2027 Daniel Kokotajloもそれを認めてる。「It’s an update towards shorter timelines, yeah…」
    https://x.com/i/status/2047329105054720249
  • OpenAIはGPT-5.5をリリース。Mythosには劣るがClaude Opus 4.7には殆どの指標(SWE Bench Pro以外:OpenAI側は暗記の問題などを指摘)で勝り、Mythosの5分の1程度のコスト(Opus 4.7と同程度)。今回GPT-5.5ではサイバーリスクに対するより厳格な分類器を導入。これまでで最も強力なセキュリティ対策を講じつつ「AIの民主化」というAnthropicに対するナラティブを掲げてる。
    https://x.com/i/status/2047397839056326849
  • UAE「政府のセクター、サービス、業務の50%がAgentic AIによって運営され、UAEを自律システムを通じてこの規模で運用する世界初の政府にします」
    https://x.com/i/status/2047277766769545352
  • 下院議員らが「脱獄」したAIの恐ろしいデモを体験。国土安全保障省のテロ対策部門は広く普及している人工知能ツールに組み込まれた安全対策を回避する方法に関する研究を発表した。
    ・国土安全保障省の研究者たちは、悪意のある者が人工知能モデルを兵器化して爆弾を製造したり、テロ攻撃を計画したり、サイバー攻撃を実行したりすることがいかに容易であるかを議員たちに示した。
    ・「これは本当に恐ろしいことです。なぜなら、AIが本来果たすべき役割は、『どのように学校を恐怖に陥れるか?』『どのような武器を使うか?』といった特定の事柄に関して、一定の制約を設けることだからです」と、オーガスト・プルガー下院議員(共和党、テキサス州選出)は述べた。
    https://x.com/i/status/2047319984851013953
  • 米国政府は主に中国のアメリカのAIを盗むための産業規模の蒸留を非難。外国勢力に責任を負わせるための様々な措置を検討。「悪意のある搾取から派生したオープンモデルはオープンではない」
    https://x.com/i/status/2047338161056219325
  • OpenAIは過去1週間にわたり、連邦政府機関、州政府、そしてファイブ・アイズの同盟国に対し、同社の新しいサイバー製品(gpt-5.4-cyber)の機能について説明を行ってきた。
    ・OpenAIは、強力なセキュリティ対策を施したモデルのバージョンをより広く提供する一方で、Trusted Accessプログラムを通じて、よりサイバー攻撃に寛容なバージョンのモデルを防御担当者に提供するという、二本立てのアプローチを採用している。
    ・この情報共有パートナーシップには、米国に加え、オーストラリア、カナダ、ニュージーランド、英国も参加している。
    https://x.com/i/status/2046889193411072444
  • Codex、エージェント:
    • Codexは細部のコード作業をエージェントに任せ、人間は高次の構造や設計を管理するためのプラットフォームになる
    • 今後数週間にも、エージェント基盤に関連するリリースがある
  • スターゲートについて:
    • Stargateなどのインフラ縮小報道について、サムは一部サイトの個別判断はあっても、OpenAIは可能な限り計算資源を建設し続けると否定
    • グレッグは、OpenAIの事業は計算資源を借りるか買って、それをマージン付きで再販する非常に単純な構造だと説明
    • 需要が無限にあるため、プラスのマージンがあればスケール可能
    • 自社チップに非常に興奮している
    • サムは、ロボティクスが「ChatGPT級の瞬間」を迎えるまでには時間がかかるが将来明確に重要だと語る
    • Anthropicとの比較で、OpenAIがコーディングで現実の乱雑なリポジトリへ適用する重要性をAnthropicより遅く理解した
    • その競争がOpenAIの思考を引き上げ、現在はCodex対Claudeで多くの点で有利な結果が出ている
  • 強力モデルの公開、政府との関係:
    • カイリーは「一部のモデルが強力すぎるため特定企業だけに制限されるようになった現在、公開を続けるべきか」と質問
    • サムは、AIを小さな集団の手に留めたい人たちは長く存在し、正当な安全懸念もあるが、恐怖ベースのマーケティングは「自分たちだけが信頼できる」という支配の正当化に使われやすいと述べる
    • 今後「危険すぎて公開できないモデル」というレトリックは増え、本当に危険なモデルは異なる方法で公開する必要がある
    • OpenAIはサイバーセキュリティをPreparedness Frameworkの一部として長く扱い、信頼アクセスプログラム、緩和策を考えてきた
    • Mythosはマーケティングではなく、サイバーセキュリティに関してすばらしいモデルだと評価
    • OpenAIには、この種の強力な能力を世界に出す納得のできる計画がある
    • モデルが強力になるほど米政府を支援することは重要になる
    • 主要なAI企業が米政府を支援しない未来に良い未来はない
    • AI業界の対立は、一部の人々が自分だけが正しくできると信じ、無限の利害を理由に有害な行動へ向かっている
  • 個人的攻撃、訴訟、過去の安全性言説をどう見直すか:
    • アシュリーは、技術進歩を止めたい勢力が過激化するSF的な展開が現実味を帯びているように見えると話す
    • サムは、こうした緊張は高まると見ており、自宅への攻撃を「恐ろしい」と語る
    • ドゥーマリズム的な語りや、他研究所によるOpenAIへの語りが助けになっていない
    • グレッグは、事件当日もサムが不可欠な仕事を続けていたと称え、サムのレジリエンスは極端で過小評価されていると話す
    • 近い将来に出る新モデルは「本当に良いモデル」で、すべての人に役立つ
      https://x.com/i/status/2046870618545746054
  • 能力とアラインメントは決して直交する目標ではなく、一方に優れた組織は他方にも優れている。世界への反復的な展開は、その両方をより強固にする助けとなる。強い直交性テーゼを退けよ。
    → OpenAIの哲学は能力とアライメントの相似性と反復的な展開なのを象徴している。
    https://x.com/i/status/2046837121596690450
  • OpenAIの内部の多くの人は安全性に気をつけているが、グローバルアフェアチームは安全性を敵視しているような出力になっているように見えるという話。
    https://x.com/i/status/2046827259886227751
  • Discordの少数の不正ユーザーグループがMythos AIモデルにアクセスした。
  • ユーザーは、Anthropicの第三者請負業者の従業員として持っていたアクセス権を利用したり、インターネット上の調査ツールを使用したりするなど、複数の手法を組み合わせてMythosへのアクセス権を獲得した。
  • Anthropic社は不正アクセスに関する報告を調査しており、現時点では、そのアクセスが同社のシステムに影響を与えているという証拠はないと述べている。
  • 同グループは新しいモデルをいじってみることに興味があり、それらを破壊しようとしているわけではない、と関係者は述べた。同グループはMythosモデルでサイバーセキュリティ関連のプロンプトを実行したことはなく、代わりにAnthropicによる検出を回避するために、シンプルなウェブサイトの構築などのタスクを試している、と関係者は語った。
    https://x.com/i/status/2046761875275497968
  • 国家安全保障局(NSA)は、NSAを管轄する国防総省の高官らが同社を「サプライチェーンのリスク」だと主張しているにもかかわらず、 Anthropic社のこれまでで最も強力なモデルであるMythos Previewを使用していると、2人の情報筋がAxiosに語った。
    https://x.com/i/status/2046019493235941531
  • Deanによる洞察力ある記事:
    「西側諸国に求められるのは、最も稀な種類の政策、すなわち賢明な中間路線である。まず、最も深刻なカテゴリーのAIリスク――サイバー攻撃、生物兵器開発、長距離自律システムなど――に対する透明性を促進することから始めることができる。カリフォルニア州とニューヨーク州はすでに、軽量なアプローチで米国内をリードしてきた。連邦政府はこれを全国的な基準とし、同時に米国AI標準・イノベーションセンターやその他の政府機関に資金を提供して、フロンティアAIシステムの国家安全保障リスクに関する専門的なテストを実施させることができるだろう。

    さらに一歩進めて、フロンティアAI企業の安全性に関する主張やセキュリティ手続きを検証できる民間組織のネットワークも構築すべきである。こうした組織の初期的な事例は、Model Evaluation and Threat Research、Apollo Research、AI Verification and Evaluation Research Instituteといった団体の形ですでに存在している。これらは独立した超党派の専門機関であり、最大手のAI開発企業に対して監査的な検査を行い、モデルのセーフガードに関する各社の主張が実態と一致しているかを確認することができる。また、国家安全保障や地政学などに関する連邦当局者からの具体的な質問にも回答できるだろう」
    https://x.com/i/status/2045895169632027106
  • ダリオ・アモデイ氏は昨日のフィナンシャル・タイムズのインタビューで、オープンソースのモデルと中国の開発者たちが6~12ヶ月以内にMythosの機能を再現できるようになるだろうと推測していると述べた。
    https://x.com/i/status/2045513655773733148
よかったらシェアお願いします
  • URLをコピーしました!

この記事を書いた人

bioshokのアバター bioshok リサーチフェロー

大学では半導体に関する研究をし、大学院では自然言語処理に関する研究を行う。
Xの @bioshok3 にてAIに関するトレンドとAIがもたらす深刻なリスクに関して発信している。

メールマガジン「週刊UNVEIL」(無料)をご購読ください。毎週、新着情報をお届けします。

目次