データボイド脆弱性の危険性 「偽・誤情報の棚卸し2024」第3回

  • URLをコピーしました!

本記事は、Data & Societyによる「偽・誤情報の棚卸し2024」の紹介の第3回です。

デジタルメディアと社会的影響の専門家で、ジョージタウン大学教授、Microsoft Researchの研究者、そしてData&Societyの創立者でもある、Danah Boyd氏は2019年、Microsoft ResearchのプロジェクトマネージャーMichael Golebiewski氏と共に「Data Voids – Where Missing Data Can Easily Be Exploited」と題された報告書を発表した。この報告書で、彼女たちは「データボイド」という概念を提唱している(後に詳述)。
Danah Boyd氏はこの領域の世界的な権威のひとりであり、日本でもっとも知られていないひとりでもある。

そのDanah Boyd氏が先日、Data&Societyに「Making Sense of Data Voids – Reckoning with Mis/Disinformation in 2024(データボイドを理解する/2024年の誤情報・偽情報への対処)」と題された文章を寄稿した。データボイドは単なる技術的な脆弱性ではなく、複雑に絡み合った「Sociotechnical(社会技術的)」な問題であるということを正しく理解しなければ、我々はこの問題に対処できないということが説明されている。

目次

そもそもデータボイドとは?

データボイドは文字どおり「データの空白」を指している。特定のトピックや用語について検索したとき、情報が不足している(あるいはまったく存在していない)場合、信憑性の低いサイトでも検索結果の上位に表示されてしまうという問題だ。この脆弱性は、悪意のあるコンテンツの拡散や詐欺的な行為、あるいは不正確な情報の流布などに利用されている。詳しくはデータボイドに関する日本語のもっともくわしい解説シリーズを参照いただきたい(おそらく世界でももっともくわしい)。

データボイドは現在進行形で中露や極右などの反体制グループを始めとする攻撃者に利用されており、不信似感じた情報をネットやSNSで検索する多数の人々を偽・誤情報に取り込んでいる。もちろん、グーグルなどの検索エンジンは対応に努めている。昔に比べて、「検索条件と十分に一致する結果が見つかりません」あるいは信頼できる検索結果が出ない可能性があります(だったかな?)といった表示をよく表示されるようになった。これはデータボイドへの対応と考えられる。

「検索」するユーザーの目的と影響

検索エンジンは知識を提供するように設計されているが、無知に対処するようには設計されていない。検索エンジンが有用なデータを提供できない場合には脆弱性が生じる」と説明するDanah Boyd氏は、今回のレポートで以下のように記している。

・人々は様々な理由で(多くの場合は「天気」「レシピ」「宿泊先」などの欲しい情報を得るために)検索エンジンを利用するが、好奇心や退屈しのぎで検索を行う人もいる。その道筋は見たものによって形成されることもある。

・これに関しては、否定的な側面に焦点が当てられやすい(たとえば寝る時間になっても探求を止められなくなる、ますます疑わしい情報を探し続けてしまうなど)。もちろん、自然と「有害な情報」に触れて過激化することも、そこに含まれる。

・これらのダイナミクスが複雑なのは、利用可能なコンテンツの構造や、それに遭遇するアルゴリズム(検索など)、そしてインターネットを徘徊する人々の心の状態が交差しているからだ。

メディアの効果

そして彼女はこう記している。

・人々は連続殺人犯ドキュメンタリーを見たからといって連続殺人犯になるわけではない。しかし一部のコンテンツには悪影響を受けるのも事実だ。

・おそらく最も悪名高いメディア効果の一つに「自殺願望」がある。自殺を考えている人が、自殺で亡くなった人の話題に触れることで精神的に追い詰められるのは、インターネットが登場する前から明白だった。最近では、ソーシャルメディアや検索エンジンが自殺願望や自殺の実行にどのように関与するかという問題が繰り返し提起されている。ユーザーが自殺の可能性を高めるようなコンテンツに触れることに対して、検索エンジンが責任を負うべきか、といった問題だ。

・オンラインによる「過激化」も重要な問題だ。社会学者たちは、孤立感、孤独感、失望感、または周囲から切り離されていると感じる人々が、ギャング、カルト、テロ組織に関わるリスクが高まってしまうことを発見している。これと同じ心理状態が、宗教やマルチ商法に対する興味を引き起こすこともある。つまり人々は帰属感を求めている。

・陰謀論者や白人至上主義者たちがデータボイドを悪用する戦略について議論しているのを見たとき、私たちが心配したのは、彼らが「コミュニティを求める脆弱な人々」を標的にしていたことだった。彼らは「ある文脈では無害かもしれないコンテンツ」を提供していたが、別の文脈においては危険そのものだった。

構造的な脆弱性

データボイドがどのように悪用されているのかを説明していたとき、彼女は「陰謀論者たちが、いかに素早く速報ニュースに飛びついて、「有識者が適切に状況を報告するよりも前に』陰謀論を織り込むかという点も懸念していた」と記している。

・私たちには、それを心配する理由が充分にあった。当時はQアノンが注目を集め、人々はコミュニティや「事実」を求めてQフォーラムに集まっていた。「孤独な人々が陰謀論に触れ、活気あるコミュニティに帰結する」という有害な組み合わせは悪化していくばかりだった。

・また、リアルタイムの事件に対応する新たな製造コンテンツの波が見られた。「速報ニュースが配信された瞬間に虚偽の情報を提供すること」に執心している人々と、ジャーナリストたちは競うことができていなかった。

社会のシステムと技術のシステム

そして彼女は、「過激化を防ぐアルゴリズムの設計」をテクノロジー企業に求めがちな傾向に対しても警鐘を鳴らしている

・有名な陰謀論者アレックス・ジョーンズは逮捕され、何度も有罪判決を受けたが、人々の関心は「技術システムを悪用する人々」から、「アルゴリズムを作成した企業」のほうへと移った。そして企業は、ユーザーを有害なコンテンツや過激なコミュニティに導くアルゴリズムを修正するよう求められた。

つまり政策立案者たちは「過激化させないアルゴリズムを設計すること」を企業に呼び掛けた。残念ながら、この取り組みはメディアの効果に対する間違った論理に根差している。

・「Sociotechnical(社会技術的)」という用語は、社会とテクノロジーに関する議論でますます利用されるようになっている(そして誤用されている)が、いまだ「sociotechnical accountability(社会技術的責任)」を想定するための強いフレームワークはない。

・テクノロジー企業がすべきこと、立法者がすべきこと、ユーザーの責任などについて焦点が当てられがちだが、いずれも「社会のシステムと技術のシステムが深く絡み合っている状況」に充分に対処できる方法を提供できない。

社会技術的な搾取

つまり彼女は「アルゴリズムの変更」だけではデータボイドの脆弱性に対処できないと主張しており、「結局のところ、データボイドとは人々、慣行、技術、企業との絡み合いから生じている社会技術的な搾取の一形態」と説明している。そして、それは検索システムだけの問題ではない。

・検索エンジンは、一般の人々が依存している強力なツールだ。権力の配置を決定しようとする人々は、自らの目的のために検索エンジンの脆弱性を見つけて悪用し、そのシステムの担当者たちと「モグラ叩き」のようなゲームを引き起こしている。

・その一方で、ユーザーたちは様々な期待や意図をもって(さらには様々な精神状態で)検索システムに触れ、情報のコントロールをもくろむ競争の中に巻き込まれている。

・しかしテックラッシュ(大手テクノロジー企業に対する不信感や反発心)が展開される中で、多くの批評家たちは、この問題を「不完全なシステムと、それを自分の思い通りにしようと奮起している人々との相互作用」だとは捉えようとせず、単に「悪い技術者が生み出した問題」として捉えようとした。陰謀論者や、メディアの操作を企む人々の温床と戦おうとする人はほとんどいなかった。

・データインフラやアルゴリズムシステムの悪用は依然として根深い問題で、それは検索エンジンに限らず、ソーシャルメディア、AI、アルゴリズムによる意思決定のすべての側面に影響を与えている。そして昨今の生成AIシステムの波は、アルゴリズムシステムを複雑にして新たな課題を生み出している。

・技術の設計者だけに責任を負わせるのは問題だ。データボイドを利用した搾取は、「社会技術的攻撃」の一つのパターンである。「データボイド」のプロジェクトは、アルゴリズムシステム、データ、メディア操作が絡み合った問題に対処する一つの方法を示している。

また、この論考では言及されていなかったが、既存のデータから学ぶAIも深刻なデータボイド脆弱性を持っている。たとえば、「代表的な10の生成AIモデルが32%の確率で親ロシアの誤・偽情報サイトの情報を回答していた」という問題や、言語によって異なる答えを返す問題、AIがコンテンツを自動生成するピンクスライムジャーナリズムによって学習元データが汚染される問題もある。こうした問題の解決策はきわめて難しい。

最後に補足すると、日本はデータボイド脆弱性への攻撃に弱い。日本国内で利用されてるネット上で検索機能を提供している検索エンジンやSNSプラットフォームの多くは、日本発ではないためデータボイドが生じやすい。また、日本発のサービスの多くはデータボイドという言葉すら知らないことが多い。偽・誤情報対策を各省庁が発表しているが、データボイドに言及しているものを見たことがない。日本は偽・誤情報についてはナレッジボイドあるいはエフォートボイドの世界なのだ。

よかったらシェアお願いします
  • URLをコピーしました!

この記事を書いた人

目次