ポストAPI時代におけるソーシャルメディア・データアクセスの変遷と提言

  • URLをコピーしました!
目次

はじめに

2000年代半ばにアプリケーション・プログラミング・インターフェース(API)が登場して以来、ソーシャルメディアのデータはデジタル社会科学研究の根幹を成してきた。例えば、新型コロナウイルス禍におけるソーシャルプラットフォーム上でのユーザーの新型コロナウイルスに対する感情分析と発信するユーザーの変化を調べる研究[1]などにAPIは使用されている。しかし、プラットフォーム企業の経営判断や社会的スキャンダル、法規制の変遷により、研究者が依拠してきたデータの安定性は根底から揺らいでいる。「The Post-API Age of Social Media Data Access: Past, Present, and Future」https://doi.org/10.1177/00027162251372557 )の著者であるDeen Freelonらは、2018年の時点でこの状況を「ポストAPI時代」と定義した。これは、企業が自社の裁量により、いつでも、いかなる理由でもデータアクセスを制限・廃止できる危うい時代を指す。本稿では、約20年にわたるデータアクセスの歴史的変遷を総括し、2025年現在のデータアクセス体制を4つの類型に整理する。その上で、学術研究の自律性と民主的な監視体制を再構築するための規範的な提言を行う。

歴史:変容するプラットフォームのデータ統治

本論文では、過去20年のデータアクセスの歴史を、プラットフォームのデータ提供方針に基づき4つの期間に区分している。

自由放任期(Laissez-faire Period / 2006-2011)

2006年にTwitterとFacebookが最初のAPIを公開したこの時期は、データ提供が極めて開放的であった。当初のTwitter APIはログインすら不要であり、個人識別情報を含むデータセットの取得と公開が広く許容されていた。Facebookにおいても、開発者は公開されているページ、グループ、個人のプロフィールを容易に取得可能であった。この「手放し」の時代、データアクセスには高度なプログラミングスキルが必須であったため、初期の研究は主にコンピュータサイエンス分野から生じ、社会科学への普及には時間を要した。

認証期(Authentication Period / 2011-2018)

2011年3月、TwitterがAPI利用に個人アカウントの紐付けを義務付け、データセットの共有を禁止したことで、管理強化の時代が幕を開けた。この時期、アラブの春やウォール街占拠運動などを通じて、政治・社会におけるソーシャルメディアの影響力に対する公衆の関心が急速に高まった。研究需要が拡大する一方で、プラットフォーム側は「遡及的(過去の調査)」なアクセスに制限を設け始め、資金力のない研究者がリアルタイムで突発的な事態を追跡することを困難にした。

選択肢制限期(Limited Options Period / 2018-2020)

2018年、ケンブリッジ・アナリティカ事件を受けてMeta社(旧Facebook)が学術向けAPIを完全に閉鎖したことで、アクセスの不確実性は決定的なものとなった。公式なデータ取得手段が激減する中、研究コミュニティはプラットフォームとの不透明な関係や、極めて限定的な代替案(Social Science One等)への依存を強いられることとなった。

学術協力期(Academic Cooperation Period / 2020-2023)

EUのGDPRやDSAといった法規制の進展を受け、プラットフォーム側が「審査制の学術窓口」を形式的に整え始めた時期である。MetaのCrowdTangle提供やTwitterの学術専用トラックなどが一時的に門戸を開いたが、これらの協力体制は企業の評判管理や経営陣の交代によって容易に覆される脆さを露呈した。

2025年におけるデータアクセス体制:4つの類型

報告書は、現在の不透明なアクセス環境を以下の4つの体制に分類し、それぞれの機能不全を指摘している。

  • Laissez-faire API(自由放任型):YouTubeやRedditが継続している形式。技術力さえあれば無料でアクセス可能だが、レート制限による「速度の壁」が大規模研究を阻害している。
  • Academic API(学術アクセス型):TikTok等が採用。所属機関の審査を必要とし、2時間ごとのトークン失効や「30日ごとのデータ消去義務」といった過酷な技術的・運用的制約を伴う。
  • Pay-to-play API(課金型):X(旧Twitter)に代表される体制。法外な月額料金を課すことで、研究資金の乏しい研究者や機関を組織的に排除している。
  • Academic Walled Garden(学術的クローズド環境):Metaの「Meta Content Library」が典型。分析を自社管理下の「クリーンルーム」内に隔離し、外部データとの結合を禁止することで、研究の自由度を制限している。

この論文に付け加えると,Xは2026年2月からPay-Per-Use(従量課金プラン)にAPIの料金体系が変更されており,以前に比べると安い料金で利用できるようになりましたが、社会科学研究がプラットフォームの環境に影響されやすい非常に不安定な状況であることは変わりません。

よりよいデータアクセス体制の構築に向けて:規範的提言

ポストAPI時代の停滞を打破するため、報告書は以下の6つの柱に基づく提言を掲げている。

  • データアクセス:審査権をプラットフォームから剥離し、中立的な専門家機関へ外部委託すべきである。評価の焦点を「研究の優劣」ではなく、安全にデータを扱うための「技術的能力の確認」に移行させ、迅速な承認を実現すべきである。
  • データ形式:研究の自由を担保するため、原則としてデータのローカル・ダウンロードを認めるべきである。特定の閾値に基づくダウンロード制限は、小規模コミュニティの研究を不当に阻害する。
  • データ管理:科学的再現性の観点から、研究者は取得時点のデータセットを固定(保存)する権利を明示的に認められるべきである。プラットフォーム上での削除に連動した強制消去は、科学の厳密性に対する脅威である。
  • データ利用:企業側による恣意的な研究テーマの制限や、外部データとの結合禁止規定を撤廃し、社会科学本来の多角的な分析を保障すべきである。
  • データコスト:学術界の予算規模に配慮した合理的な価格設定や、所得階層に応じた傾斜料金、あるいは統計的推計が可能な「ランダムサンプル」の安価な提供を検討すべきである。
  • データ共有:ユーザーのプライバシー保護とオープンサイエンスを両立させるため、コンテンツIDを共有し各自の環境でデータを復元する「リハイドレーション(再給水)」プロトコルを再評価し、標準化すべきである。

結論

ポストAPI時代の教訓は、プラットフォーム・データへのアクセスが、研究者の制御不能な外部要因に永続的に左右されるという事実である。私は2020年頃、Twitter(現X)のAPIをプログラミング学習のために利用していたが、仕様変更に関してはほとんど把握しておらず驚きがあった。
今回調べる過程で、私が以前フォローしていたTwitter botも更新を停止していることが判明した。私がかつて享受したような「安定」したプラットフォームという幻想は、技術や政策の変遷とともに劣化し、消失した。将来的にデータの透明性を確保できるかどうかは、法的な安全網(EUのDSA等)の整備と、研究コミュニティ自らがソフトウェア開発スキルを磨き、非公式な手法をも含めた独自の調査能力を維持できるかにかかっている。
データの主権を企業の密室から公共の監視の下へと取り戻すこと。これこそが、デジタル社会における民主主義と科学的誠実さを守るための喫緊の課題である。

参照:
[1]ソーシャルメディアを用いた新型コロナ禍における感情変化の分析
https://www.jstage.jst.go.jp/article/tjsai/35/4/35_F-K45/_pdf

よかったらシェアお願いします
  • URLをコピーしました!

この記事を書いた人

anon press編集部のメンバーで工学系の学生

メールマガジン「週刊UNVEIL」(無料)をご購読ください。毎週、新着情報をお届けします。

目次