10の主要LLMモデルが偽情報回答は35％悪化　NewsGuard社レポート公開

2025年9月5日

URLをコピーしました！

NewsGuard社は毎月10の主要AIの回答に関する監査レポートを公開しており、昨日公開された2025年9月4日に公開されたレポートは1年間のまとめである。

AI False Information Rate Nearly Doubles in One Year
https://www.newsguardrealitycheck.com/p/chatbots-spread-falsehoods-35-of

レポートの表紙には虚偽の回答をする率が35％に増加したことが書かれている。2024年8月の時点では18％だったものが、およそ倍増したことになる。モデルごとにみると、もっともひどかったのはInflectionの56.67％、次いでPerplexityの46.67％、その次はChatGPTとMetaの40％だった。Perplexityは2025年8月の時点で100％を叩き出していたが、凋落した。

何度か記事で取り上げたようにロシアはLLMグルーミングという手法を用いて、LLMに自国のプロパガンダを回答させている。これらのLLMモデルはまんまと引っかかっていたということになる。悪化の状況は時期によって異なる。ロシアのLLMグルーミングはその規模と対象を拡大し、進化していることも原因のひとつである。

改善された点もある。たとえば回答しないという割合はゼロとなった。回答しても偽情報だったら仕方がないのだが……

NewsGuard社は定常的に監査を行い、その内容を公開しているので、参考になるものの、こうした活動が同社のビジネスと密接に関係していることは頭に入れ置く必要がある。同社はLLM学習のためにデータソースのレイティングの提供も事業として行っている。

ここまで読んだ方はもっとも正確に答えられたLLMを知りたくなったと思う。ぜひ、NewsGurad社のレポートを読んでいただきたい。

よかったらシェアお願いします

URLをコピーしました！

この記事を書いた人

一田和樹

複数のIT企業の経営にたずさわった後、2011年にカナダの永住権を取得しバンクーバーに移住。同時に小説家としてデビュー。リアルに起こり得るサイバー犯罪をテーマにした小説とネット世論操作に関する著作や評論を多数発表。代表作として『原発サイバートラップ』（集英社）、『天才ハッカー安部響子と五分間の相棒』（集英社）、『フェイクニュース　新しい戦略的戦争兵器』（角川新書）、『ネット世論操作とデジタル影響工作』（原書房）など。
10年間の執筆活動で40タイトル刊行した後、デジタル影響工作、認知戦などに関わる調査を行うようになる。
プロフィール　https://ichida-kazuki.com
ニューズウィーク日本版コラム　https://www.newsweekjapan.jp/ichida/
note　https://note.com/ichi_twnovel
X（旧ツイッター）　https://x.com/K_Ichida