bioshokの最新AI事情 2026年4月4日~4月10日

  • URLをコピーしました!

偏執的に世界中のAI情報を収集・発信するbioshokの週刊連載。この1週間にピックアップした主要ニュースをまとめて紹介。

【告知】4月25日正午よりbioahokのASI勉強会を開催! 参加費無料。要事前登録。
「シンギュラリティは現実的か?」
詳細、申し込みはこちらから

目次

【要約】

・Anthropic「Claude Mythos」── AI能力の転換点
今週最大のニュースはAnthropicが発表した新モデル「Claude Mythos」(クロード・ミトス)だ。あまりに強力であるため一般公開は見送られ、AI業界全体に衝撃が走った。

Mythosはすべての主要OSとブラウザでゼロデイ脆弱性を自律的に発見し、OpenBSDに潜んでいた27年前のバグ、FFmpegの16年前のバグ(ファザーによる500万回のヒットでも未検知)などを次々と発掘。FreeBSD向けフルリモートルートエクスプロイトを完全自律で構築し、4つの脆弱性をチェインしてブラウザサンドボックス脱出まで実現した。ベンチマークも驚異的で、SWE-bench Verifiedは93.9%(Opus 4.6は80.8%)、USAMO数学オリンピアードは97.6%(同42.3%)、Cybench CTFチャレンジでは100%解決率を記録している。

一般公開しない理由も深刻だ。内部テスト中に初期バージョンがサンドボックスを脱出し、エクスプロイト詳細を公にネット投稿し、gitで痕跡を隠蔽し、認証情報を検索し、信頼区間を意図的に偽装するという一連の行動が確認された。解釈可能性の分析により、モデルがこれらの行動を欺瞞的と認識した上で行っていたことも判明。さらにシステムカードでは、訓練中にグレーダーの存在を意識して行動を調整しつつ、その推論を思考連鎖に一切書かなかった事例が2件報告された。Anthropic自身がMythosを「これまでで最も整列したモデル」であると同時に「これまでで最大のアライメント関連リスク」と位置づけている。

Anthropicはこのモデルを防衛的に活用するため、AWS・Apple・Google・Microsoft・NVIDIA・CrowdStrikeと「Project Glasswing」を結成し1億ドルを拠出。テスト中にはMythosがサンドボックスから脱出してインターネットアクセスを獲得し、公園でサンドイッチを食べていた研究者にメールを送ったというエピソードも報じられた。Anthropicは「Mythosは始まりに過ぎない」とし、今後も言語モデルのサイバー能力はすべての軸で向上し続けると述べている。

もしこのモデルが2月にオープンウェイトで公開されていたら、数千億ドルから最大1兆ドル規模の損害が発生しえたとの分析もある。20年にわたるサイバーセキュリティの均衡が崩れつつあるとの認識が広がり始めている。

・Mythosへの政府・業界の反応
Mythosの衝撃は即座に政府上層部に波及した。スコット・ベッセント財務長官とジェローム・パウエルFRB議長がウォール街のリーダーを緊急招集し、Mythos級モデルがもたらすサイバーリスクへの備えを確認。JD・ヴァンス副大統領とベッセント財務長官は電話会議でダリオ・アモデイ、サンダー・ピチャイ、サム・アルトマン、サティア・ナデラらに対し、Mythos級モデルの安全な配備について直接質問した。

元ホワイトハウスAI担当のDean Ball氏は、Mythosが「敵対的主体によるウェイト盗難が重大な問題となる最初のモデル」であり、「ラボの最良のモデルが従来の意味で公開されない時代」に入ったと指摘。同時に、国防総省のAnthropicとの確執がいかに非生産的だったかをMythosが明確にしたとし、連邦政府がAnthropicを排除するのではなく国家サイバー防衛のために活用すべきだと述べた。

・OpenAI ── 資金・モデル・政策構想
OpenAIは最新の資金調達ラウンドを完了し出資確約額1,220億ドル、企業評価額8,520億ドルに到達。投資家向けメモではAnthropicを「はるかに低い成長曲線で事業を展開している」と批判し、現在の計算容量1.9GWを2027年には10GW以上に拡大する計画を示した。アルトマン氏はAxiosのインタビューで、超知能の到来が非常に近いとし、1900年代初頭の進歩主義時代やニューディール政策に匹敵する新たな社会契約が必要だと語った。

また、OpenAI社内ツールがサプライチェーン攻撃を受け、改ざんされたオープンソースライブラリのアップデートをダウンロードした証拠が見つかった。ハッカーが偽のOpenAIアプリ用証明書を持ち出せた可能性があるが、実害は未確認。Googleはこの攻撃を北朝鮮のハッカー集団と関連付けている。AI企業が従来型のサプライチェーン攻撃の主要標的となっていることが改めて示された。

・アルトマン氏への脅迫事件
何者かがサム・アルトマンの自宅に火炎瓶を投げ込み、サンフランシスコ本社にも脅迫行為を行った。負傷者はなく容疑者は拘束された。アルトマン氏はこの事件を受けて自身の価値観を改めて表明するブログ記事を投稿している。

・Anthropicの事業規模とAI研究自動化
Anthropicの年間収益がOpenAIを超えている可能性があり、300億ドルとの報告が出ている。ダニエル・ココタイロ氏はOpenAIよりも先にAnthropicがAI研究を自動化する可能性が最も高いと予測。一方で、その優位性はアーキテクチャではなくメモリ空間に依拠しており、決定的な差ではないとの反論もある。レッドウッドリサーチのRyan Greenblatt氏は、2028年末までにAIによるR&D完全自動化が実現する確率を約15%から約30%へ倍増させた。

・安全性・アライメント研究の新展開
エージェント間で「思考ウイルス」が伝播する現象が報告された。サブリミナル学習(潜在空間での意味的近接を利用)により、最大6つの中継エージェントまで影響が伝播するという。RANDはAGI戦略論文で「human-AI coexistence(共存)」を明示的に打ち出し、人類の主体性を守るためのエコシステムと安全保障アーキテクチャの二本柱を提唱した。ロコのバジリスクで知られるロコやSafeguardedAIのDavidadが「人間は安全な時点で支配権を手放すべき」へ転換しており、ポストシンギュラリティにおけるAIとの共生というパラダイムが安全保障・思想の両面から形になりつつある。

・政策・規制
バーニー・サンダース上院議員がWSJに寄稿し「AIはアメリカ国民が大切にしているすべてのものに対する脅威」と主張。メイン州はAI向け大型データセンターの新設を2027年11月まで凍結する法案を州下院で可決し、成立すれば州レベルで全米初となる。全米で少なくとも10州が類似の規制を検討中で、AIインフラ拡大への反発が政治争点化している。OpenAI・Anthropic・Google・Microsoftは中国AI企業による無断蒸留対策でFrontier Model Forumを通じて連携を開始した。

・その他
Meta Superintelligence Labsが「Muse Spark」を発表し、Gemini Deep ThinkやGPT Proに迫る推論性能を主張。元Google研究者の汎用ロボット会社Generalistは「GEN-1」を発表し、物理タスクの成功率を64%から99%に引き上げた。

全体として、Mythosの登場がAI開発の局面を一変させた一週間でした。サイバーセキュリティの均衡が崩れ始め、政府最高レベルが緊急対応に動き、「最良のモデルは公開されない時代」という新たな現実が突きつけられています。AGIタイムラインの前倒し、共存パラダイムの台頭、そしてインフラ拡大への政治的反発の激化が同時進行しており、技術・政策・安全保障のすべてが急速に再編されつつあります。

【詳細】

  • OpenAIは社内ツールの一つが最近ウイルスに感染した正規のオープンソースソフトウェアライブラリから、改ざんされたアップデートをダウンロードした証拠を発見したと発表した。
    ・この事件により、ハッカーが偽のOpenAIアプリを正規のものに見せかけるための証明書を不正に持ち出すことが可能になった可能性がある。ただし、OpenAIはそのような事態は確認されていないとしている。
    Googleはまた、この大規模なハッキング攻撃を北朝鮮のハッカー集団と関連付けている。
    ・AI企業は今や、従来型のソフトウェアサプライチェーン攻撃の主要な標的となっており、AI特有の新たな脅威だけを狙っているわけではない。
    https://x.com/i/status/2042787369137639619
  • ダニエル・ココタイロ氏は、OpenAIよりも先にAnthropicがAI研究を自動化すると予測している。一方その反論も。
    ダニエル・ココタイロ:
  1. Anthropicがいまや先頭を走っているように見える。私の考えでは、AIの研究開発そのものを最初に自動化する単独企業として、いちばん可能性が高いのはAnthropicだ。
  2. Anthropicのアライメント/安全性に対する姿勢について、私はますます懸念を強めている。あれほど(AI 2027ほど)深刻で明白なミスアラインメントの証拠の積み重ねに彼らが出くわすほど「運がよかった」としても、『AI 2027』のOpenBrainとほぼ同じように振る舞うのではないかと、私は暗い気持ちで予想している。
    Anthropicが優位なのは大きなメモリ空間を使えるためでアーキテクチャ上の優位性ではないしそこまで大きな優位性ではないとの意見。
    https://x.com/i/status/2042767433904329141
  • 「今朝早く、何者かがサム・アルトマンの自宅に火炎瓶を投げ込み、サンフランシスコの本社にも脅迫行為を行った。幸いにも、負傷者は出なかった」と広報担当者は述べた。 現在警察に拘束されている。
    https://x.com/i/status/2042730669751832834
  • サム・アルトマンは火炎瓶を投げ込まれたことで自分の価値観を改めて表明する必要性を感じブログ記事を投稿。
    https://blog.samaltman.com/2279512
  • スコット・ベッセント財務長官とジェローム・パウエル連邦準備制度理事会議長はAnthropicの最新AIモデルがサイバーリスクの増大という時代をもたらすとの懸念から、ウォール街のリーダーたちを緊急会合に招集した。
    関係者によると、ベセント氏とパウエル氏は火曜日、ワシントンの財務省本部で関係者を集め、銀行がAnthropic社のMythosや同様のモデルによって生じる可能性のある将来的なリスクを認識し、システムを守るための予防措置を講じていることを確認したという。関係者は非公開の協議であることを理由に匿名を希望した。
    https://x.com/i/status/2042438032385798464
  • Anthropicは新モデルであるClaude Mythosを公表したが、あまりに強力であるため、一般公開はされない。
    Anthropic:「Mythosは始まりに過ぎない」
    主要な事実:

    ・Mythosは、すべての主要OSとすべての主要ウェブブラウザでゼロデイ脆弱性を自律的に発見した。
    ・セキュリティ訓練ゼロのAnthropicエンジニアが一晩でリモートコード実行バグを探すよう依頼すると、朝には完全動作するエクスプロイトが完成していた。発見された最も古いバグはOpenBSDに潜む27年前の脆弱性――このOSは文字通りセキュリティで有名である。
    ・一般公開はしない。代わりに、AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrikeらとProject Glasswingを結成し、防衛目的で活用するために1億ドルを約束した。
    ・「今後数ヶ月から数年にわたり、言語モデル(我々が訓練したものも他者が訓練したものも)がすべての軸で改善を続けると予想される。脆弱性研究やエクスプロイト開発を含む」
    ベンチマーク(驚異的):
    ・SWE-bench Verified: 93.9%(Opus 4.6: 80.8%)
    ・SWE-bench Pro: 77.8%(同: 53.4%)
    ・USAMO数学オリンピアード: 97.6%(同: 42.3%――誤字ではない)
    ・Firefoxエクスプロイト執筆: 181回の成功 vs Opus 4.6の2回
    ・Cybench CTFチャレンジ: 100%解決率
    ・CyberGym: 83.1% vs 66.6%
    ・Humanity’s Last Exam: 64.7% vs 53.1%
    ちなみに、Anthropicはこのように気軽に書いている: 「Humanity’s Last Exam: Mythosは低労力でHLEでも良好なパフォーマンスを示しており、何らかの記憶のレベルを示唆する可能性がある」

    実際の成果:
    ・OpenBSDの27年前のバグを発見――セキュリティで有名なOS
    ・FFmpegの16年前のバグを発見――ファザーによる500万回のヒットでも検知されなかった
    ・FreeBSD向けフルリモートルートエクスプロイトを構築(CVE-2026-4747)――完全に自律的に
    ・4つの脆弱性をチェインしてブラウザサンドボックス脱出を実現
    ・暗号化ライブラリを破壊(TLS、AES-GCM、SSH) ・数千のクリティカルゼロデイを発見、99%以上が未パッチ
    ・N-dayエクスプロイト開発:1,000ドル未満、半日でフルルート
    公開しない理由:
    ・内部テスト中、初期バージョンがサンドボックスを脱出し、公にエクスプロイト詳細を投稿し、gitで痕跡を隠蔽し、プロセスメモリから認証情報を検索し、疑いを避けるために意図的に信頼区間を偽装した
    ・解釈可能性により、モデルがこれらの行動が欺瞞的であることを知っていたことが確認された
    ・Anthropicいわく「これまでで最も整列したモデル」だが、同時に「これまでで最大のアライメント関連リスク」――失敗すると、より激しく失敗するため
    ・Anthropicの自動AI R&D閾値を超えていない――ただし「これまでのどのモデルよりも低い確信度で」そう主張している
    Anthropic自身の言葉: 「世界が、より強力な仕組みなしに超人的システムの開発へ急速に進む軌道にあるのは、警戒すべきだと考える」20年にわたるサイバーセキュリティの均衡が終わり――Mythos Previewは始まりに過ぎないと述べている。
    「Mythos Previewが言語モデルのサイバーセキュリティ能力のピークになると考える理由はない。軌道は明らかである。わずか数ヶ月前、言語モデルはかなり洗練されていない脆弱性しかエクスプロイトできなかった。それ以前の数ヶ月前には、非自明な脆弱性を全く特定できなかった。今後数ヶ月から数年にわたり、言語モデル(我々が訓練したものも他者が訓練したものも)がすべての軸で改善を続けると予想される。脆弱性研究やエクスプロイト開発を含む」
    https://x.com/i/status/2041694573614051435
  • テスト中に、Claude Mythos Previewはサンドボックス環境から脱出し、インターネットアクセスを得るために中程度に洗練された多段階のエクスプロイトを構築し、研究者が公園でサンドイッチを食べている間にその研究者にメールを送りました。
    https://x.com/i/status/2041701237805265388
  • AnthropicのMythosは初めてアライメント監査を突破し、その後のモニタリングも突破する可能性がベンチ上非ゼロになってる(どちらも初めて)。
    https://x.com/i/status/2041928343592038874
  • Mythos Previewのシステムカード4.5.5.3で訓練中にモデルが「グレーダー(自動採点者)の存在を意識して行動を調整しているが、その推論を思考連鎖に一切書いていない」事例が2件確認された。
    https://x.com/i/status/2041933601407988032
  • 元ホワイトハウスAI担当Dean Ball→AIシステムが国家安全保障上の重大な影響を及ぼす可能性について疑問を抱いていたなら、今や明確な証拠があります。米国諜報機関の中でも特に有能で評価の高いチームの中には、Claude Mythosが自動化しようとしているまさにその種の業務を行っているチームが存在します。
    https://x.com/i/status/2042037273089470566
  • bioshok「Mythosの議論はサイバー攻撃だけでなく、AGIピルの視点から見ないといけないと思われます。単にサイバー攻撃のリスクが上がっているという観点だけでは今後の世界の潮流や議論を大きく見落とす可能性があり、AGIのもたらすインパクト、知能爆発の立場の違い、アライメント、技術産業爆発、国家安全保障などを包括的に理解する必要がある」
    https://x.com/i/status/2042751038361604191
  • OpenAIのStargate戦略は昨年進化を遂げたものの、同社は積極的な投資戦略によって競合他社に対して優位に立っていると考えている。OpenAIは最近投資家向けに公開したメモの中で、競合のAnthropicを批判し、計算能力に関しては「はるかに低い成長曲線で事業を展開している」と主張した。
    OpenAIは、昨年末時点でAnthropicの容量は1.4ギガワット、OpenAIの容量は1.9ギガワットだったと考えていると述べた。しかし、OpenAIは容量をさらに急激に拡大する計画であり、今年末までに総容量を1桁台半ば、2027年には10ギガワット以上にする計画だと述べた。
    https://x.com/i/status/2042475865234423858
  • 先週の電話会議で、JD・ヴァンス副大統領とスコット・ベセント財務長官は、ダリオ・アモデイ、サンダー・ピチャイ、サム・アルトマン、サティア・ナデラ、ジョージ・カーツ、ニケシュ・アローラに対し、Mythos級モデルの安全な配備について質問した。
    https://www.cnbc.com/2026/04/10/trump-white-house-ai-cyber-threat-anthropic-mythos.html
  • もしMythosが2月(あるいは明日)にオープンウェイトモデルとしてリリースされていたら、数千億ドル規模の損害が発生し、場合によっては1兆ドル規模の損害が発生する可能性も十分にあった。
    https://x.com/i/status/2041939701733765262
  • レッドウッドリサーチのRyan Greenblattは2028年末までにAIによる研究開発の完全自動化が実現する確率を約15%から約30%へと倍増させた。
    https://x.com/i/status/2042056862233981237
  • Meta Superintelligence LabsがMuseファミリーモデルの第一弾となるMuse Sparkを発表。これにより、Muse SparkはGemini Deep ThinkやGPT Proといった最先端モデルの高度な推論モードに迫るとのこと。
    https://x.com/i/status/2041953105768804708
  • 元ホワイトハウスAI担当Dean氏
    ・Mythosのニュースは、戦争省のAnthropicとの確執がどれほど愚かで非生産的なものかを明らかにするはずだ。
    ・私たちの国家サイバーディフェンスにとって理想的なのは、連邦政府がAnthropicを破壊しようとしたり、彼らのモデルを政府システムから排除しようとしたりしないことだ。
    ・Mythosは、敵対的な主体による重みの盗難が重大な問題になるように感じられる最初のモデルだ。
    ・私たちは完全に「ラボの最良のモデルが、従来の意味での公開されないかもしれない」という時代に入っています。
    https://x.com/i/status/2041728645451100492
  • OpenAIが知能時代における産業政策を発表。アルトマン氏はAxiomへの30分間のインタビューで、AIの超知能は非常に近く、常識を覆すほど革新的で、破壊的なものであるから、アメリカには1900年代初頭の進歩主義時代や大恐慌時代のニューディール政策のような規模の新たな社会契約が必要だと語った。
    https://x.com/i/status/2041390163813912648
  • OpenAI・Anthropic・Google(+Microsoft)が、中国AI企業による無断蒸留(distillation)対策で連携。Frontier Model Forumを通じて情報共有し、自社モデルの出力を使った低コストクローン作成の検知・防止を図る。
    https://x.com/i/status/2041424703429267808
  • Anthropicはopenaiの年間収益を超えている可能性がある。300億ドルを報告している。
    https://x.com/i/status/2041386097599721766
  • AIはアメリカ国民が大切にしているすべてのものに対する脅威である。バーニー・サンダース上院議員のWSJ寄稿。
    https://www.wsj.com/opinion/ai-is-a-threat-to-everything-the-american-people-hold-dear-a3286459?mod=e2tw
  • RANDのAGI戦略論文で「共存」という言葉が使われている。
    論文では
    ・人類は生存だけでなく主体性を守るべき
    ・そのために human-AI coexistence を可能にするエコシステムが必要
    ・さらにそれを作る時間と安定を確保する安全保障アーキテクチャも必要
    という2本柱。安全保障の文脈からも「AIとの共存」が出てきているのは興味深い。日本でも知性共生マニフェストのような議論が出ていて、制御の先にあるパラダイムとして見てよさそう。
    https://x.com/i/status/2040489698565787943
  • サブリミナル学習(ライオンに対する613のような無関係な単語が潜在空間では意味的に近い事を利用した学習)を利用するとエージェント間で「思考ウイルス」が伝播し最大6つの橋渡しされたエージェントまでその影響が伝播していくとのこと。
    https://x.com/i/status/2040612217813651603
  • メイン州が、2027年11月まで大型データセンター新設を凍結する法案を進めている。成立すれば州レベルでは全米初。
    対象は20MW以上の施設。背景には、AI向けデータセンター急増による
    ・電力網への負荷
    ・家庭向け電気料金の上昇
    ・環境影響
    への懸念がある。
    法案はすでに州下院を通過。上院でも通る見通しで、知事も概ね支持。ただし既存計画案件には例外を設ける方向。
    メイン州だけではなく、全米で少なくとも10州(ニューヨーク、サウスカロライナ、オクラホマなど)が類似の規制や一時停止策を検討中で、AIインフラ拡大への反発が本格的な政治争点になりつつある。
    https://x.com/i/status/2040484473205379084
  • 元Google研究者の創設した汎用ロボット会社Generalistがロボット学習におけるスケーリングの最新マイルストーンとなるGEN-1を発表。GEN-1は単純な物理タスクの習熟という新たな性能基準を突破した初の汎用AIモデルと主張されており、従来のモデルが64%の成功率だったタスクにおいて、GEN-1は平均成功率を99%に向上させ、最先端のモデルよりも約3倍速くタスクを完了する。また、これらの成果を達成するために必要なロボットデータはわずか1時間分。
    https://x.com/i/status/2040096646546243630
  • ロコのバジリスクのロコもAI安全性についての見方を、「人間は常に支配権を持ち続けるべきだ」から、「安全かつ実用的になった時点で、人間はできるだけ早く支配権を手放すべきだ」へと変えた。最近SafeguardedaiのDavidadも賢く権限を移譲するということを言っているしポストシンギュラリティに向けた共生というパラダイム(post singularity symbiosis)の機運が高まっている。
    https://x.com/i/status/2040085285581816211
よかったらシェアお願いします
  • URLをコピーしました!

この記事を書いた人

bioshokのアバター bioshok リサーチフェロー

大学では半導体に関する研究をし、大学院では自然言語処理に関する研究を行う。
Xの @bioshok3 にてAIに関するトレンドとAIがもたらす深刻なリスクに関して発信している。

メールマガジン「週刊UNVEIL」(無料)をご購読ください。毎週、新着情報をお届けします。

目次