インターネット上のAI生成テキストが民主的言論や情報生態系に与える影響を初めてウェブ規模で定量的に検証した論文“The Impact of AI-Generated Text on the Internet”が、2026年4月14日にarXivにプレプリントとして公開された。著者はImperial College LondonのJonas Dolezal、Internet ArchiveのSawood AlamとMark Graham、StanfordのMaty Bohacek。Internet Archiveの「Wayback Machine」を用いて2022年8月から2025年5月にかけてインターネット上に公開されたウェブサイトの代表サンプルを構築し、最先端のAIテキスト検出器を適用することで、AI生成・AI補助テキストの普及率とその影響を実証的に測定した。コードとデータはhttps://ai-on-the-internet.github.ioで公開されている。
研究の問いと設計
本論文が解こうとした問いは3つに整理される。第1に、AIテキストがインターネットに与える影響について米国成人はどのような信念を持っているか。第2に、2022〜2025年に公開されたウェブサイトのうち、実際に何%がAI生成テキストを含むか。第3に、一般に信じられている「AIテキスト普及の悪影響」仮説は実証的に正しいか。
研究者らはまず、文献調査とオンライン言論のテーマ分析を通じて6つの仮説を導出した。これらを「Semantic Contraction(意味的収縮)」「Truth Decay(真実の崩壊)」「Positivity Shift(ポジティブ化シフト)」「Epistemic Islands(認識論的孤立)」「Entropy Dilution(情報密度の希薄化)」「Stylistic Monoculture(文体的単一化)」と名付け、公衆調査と定量分析の両面から検証した。
データ収集の方法論は、Gargら(2025)が開発したWayback Machineへの縦断的URLサンプリング手法に基づく。CDXインデックスから時間・MIMEタイプ・URL深度・トップレベルドメインの複数次元で層化サンプリングを実施し、人気ドメインの過剰代表を対数スケールのダウンサンプリングで補正している。本研究独自の変更点として、1ホストあたり1URLの厳格な上限を設けること、HTTP 200レスポンスかつtext/html形式のみを対象とすること、月間バケットあたり1万URLを目標とすることが適用された。抽出されたHTMLからはTrafilaturaライブラリで本文テキストを取り出し、英語テキストのみを分析対象とした。
AIテキスト検出器の選定には、独立したロバストネス評価を先行して実施した。評価したのはBinoculars、Desklib、DivEye、Pangram v3の4種。評価軸は、テキスト長感度・HTML埋め込みロバストネス・モデルファミリー(GPT-4o/Claude/Gemini)間の安定性・モデルバージョン間の安定性・多言語ロバストネスの5次元。Pangram v3が最も安定した性能を示したため主分析に採用された。特に、AIテキストをHTML内に埋め込んだ場合にBinocularsが検出率を11.4ポイント落とした(プレーンテキストでのフラグ率100%からHTML埋め込みで88.6%へ)のに対し、Pangram v3はスコア分布が完全に重なる結果となった。また、Pangram v3は「完全AI生成」「AI補助」「人間執筆」の三分類スキームを採用しており、二値分類より豊富なシグナルを提供する点も採用の決め手となった。
主要結果①:インターネットの35%はAI生成・補助
最も直接的な発見は普及率の推移だ。ChatGPTがリリースされた2022年11月以前は検出可能なAI生成テキストはゼロに等しかったが、2025年前半には月間新規公開ウェブサイトの約35%がAI生成または AI補助に分類された。完全AI生成(AI補助を含まない)の割合は20〜25%前後で推移している。増加トレンドは2022年末から急激に立ち上がり、2023年中に一時停滞した後、2024年以降に再加速している。
この35%という数値は、インターネット上のテキスト生産の構造的な変化を示す。著者らはこれが「モデル崩壊」(model collapse)の理論的リスクを実証的懸念に転化させると指摘する。モデル崩壊とは、将来のAIモデルがAI生成データを再帰的に学習することで性能が劣化する現象だが、現時点でインターネットの35%がすでにAI生成であれば、次世代モデルの学習データは必然的に大量のAIテキストを含む。著者らは、事前学習段階への影響は考えられるが、ポスト学習やアライメント段階は主に新規生成または環境由来のデータを使用するため影響は限定的だろうと述べるにとどめ、この問いを将来研究の課題として位置づけている。
主要結果②:確認された仮説と否定された仮説
6仮説の検証結果は、一般的な公衆認識と実証データのあいだの乖離という形で浮かび上がる。
統計的に有意な支持が得られた仮説は2つ。
第1の「意味的収縮」仮説(仮説1)は、AI生成テキストが普及するにつれてインターネット上のアイデアの多様性が縮小するというものだ。意味的埋め込みの平均ペアワイズコサイン類似度をシグナルとして測定したところ、AIリスクスコアとの正の相関が確認された(ρ=0.47、p=0.004)。AI生成・補助サイトの平均コサイン類似度(0.0701)は非AIサイト(0.0526)より33%高い。すなわちAIテキストは意味的に互いによく似た内容を生産している。著者らはこれを、LLMが学習データ分布の平均近傍に出力が収束する傾向——いわばモデルが「安全な」中心付近に引き寄せられる特性——の反映として解釈する。言論のオーバートン・ウィンドウがアルゴリズム的に狭められていく可能性を示唆する。
第2の「ポジティブ化シフト」仮説(仮説3)は、AI生成テキストが増えるにつれてオンライン文章が人工的に明るくサニタイズされるというものだ。感情分析によるポジティブ文書率をシグナルとして使用したところ、AIリスクスコアとの正の相関が確認された(ρ=0.56、p=0.0003)。AI生成・補助サイトのポジティブ感情スコア(0.7042)は非AIサイト(0.3400)の107%高い。LLMの「おべっか的」(sycophantic)で過度に楽観的な性質の発露として解釈できるが、著者らは民主的議論の観点から問題性を指摘する。多元主義的な言論は摩擦・議論・ネガティブな社会的現実の処理を必要とするが、明るく均質化されたテキストに溢れた環境では人間の異議申し立てが周縁化されうる。この意味的収縮とポジティブ化シフトの組み合わせが、あからさまな偽情報なしに公的言論を静かに画一化・鎮静化させる潜在的メカニズムだという論点は、情報操作研究に直接接続する。
統計的に有意な支持が得られなかった仮説は4つ。
「真実の崩壊」仮説(仮説2)——AI生成テキストが増えると事実誤りも増える——は、75.1%の回答者が支持したにもかかわらず、実証的に確認されなかった(ρ=-0.19、p=0.27)。事実確認の方法論として、GPT-4o-miniを使った主張抽出と、Prolificを通じて採用した50人の人間アノテーターによる手動ファクトチェック(FEVER・AVeriTeC型の4分類スキーム)を組み合わせている。「認識論的孤立」仮説(仮説4、外部リンク密度の低下)、「情報密度の希薄化」仮説(仮説5、文章が長くなり意味が薄まる)、「文体的単一化」仮説(仮説6、個性的な文体が消えて均質な声に収束する)の3つも有意な結果は得られなかった。
仮説6の不確認は特に注目に値する。文体的単一化への信念は6仮説中最も強く、83%の回答者が支持したにもかかわらず、文字3グラムのJaccard類似度を指標とした分析ではAIリスクスコアとの有意な相関は見られなかった(ρ=0.24、p=0.17)。なお仮説5・6は有意でないとはいえ相関係数の点推定値は理論上予測される方向を向いており、検出力不足の可能性も完全には排除できない。
公衆認識と実証データの乖離
論文の重要な副次的発見は、公衆の信念と実証結果の系統的な乖離である。AIによる事実誤りの増加(仮説2)を信じる回答者は75.1%、文体的単一化(仮説6)は83.0%、というように、実証的に確認されなかった仮説ほど強い信念を持たれる傾向が観察された。
信念の強さはAI利用頻度と反相関する。AIツールを頻繁に使うユーザーのネガティブ影響への支持率(中立を除く)は76.2%であるのに対し、不頻繁なユーザーは88.3%と12.1ポイント高い。AIへの社会的影響について否定的な見方をする回答者(91.3%)と肯定的な見方をする回答者(71.1%)の間にも20.2ポイントの差が観察された。
著者らはこの乖離を「認識論的脅威」として解釈する。AIテキストが遍在化して人間の文章と区別がつかなくなるにつれ、ユーザーはすべてのオンライン情報の信頼性を割り引いて見る可能性がある——いわゆる「現実への無関心」あるいは悪意ある利用における「嘘つきの配当(liar’s dividend)」効果だ。真実の絶対的な崩壊よりも、信頼性の全般的な低下という形で問題が顕在化しうる。そしてAIを使わない層・AIに懐疑的な層がこの影響を最も受けやすいと推論する。
情報操作・偽情報研究への含意
論文は直接的に偽情報やFIMIを論じるものではないが、その含意は広い。まずAI生成テキストの急増は、経済的インセンティブに駆動された現象であり、協調的な意図を持つアクターによるものではないと著者らは強調する。しかしその結果として生まれる意味的収縮とポジティブ化シフトは、意図的な影響操作の素地を提供する。同質化した言論環境では、意図的に設計された外れ値コンテンツ——感情的に突出した偽情報ナラティブ——が際立って目立ちやすくなる。平準化と均質化が進んだ情報環境は、かえって少数の強いシグナルに対する脆弱性を高める可能性がある。
また、プラットフォームガバナンスの観点から、著者らは現行モデレーションインフラの根本的な限界を指摘する。既存のプラットフォームは、ヘイトスピーチや一定程度の事実誤りを検出・削除するためのインフラを持つ。しかし意味的多様性や認識論的品質を管理するインフラは存在しない。個別の投稿の問題性ではなく、情報空間全体の意味的多様性という集合的特性が脅かされているとき、既存の手法は無力だ。
対策として著者らが提案するのは、AIテキストの事後検出への過度な依存からの脱却だ。現時点では検出精度は高いが、AI生成技術の進化とともに信頼性が低下する可能性がある。また短いテキストでは現状でも検出が困難だ。文章の透かし(ウォーターマーキング)はすでに複数国で義務化されているが、回避が容易という問題を抱える。著者らが代替として指摘するのは、C2PAのような規格を通じた人間由来の暗号的証明と、生のコンテンツ量やエンゲージメントより意味的多様性と人間由来の検証を重視するよう検索・推薦アルゴリズムを再調整することだ。
方法論上の制約と今後の課題
いくつかの重要な制約がある。第一に、分析対象は英語テキストに限定されており、非英語圏でのAI生成普及率や影響は別途検討が必要だ。第二に、ウェブサイトから最長段落を抽出してサンプルとする手法は、ページ全体の内容を代表しない場合がある。第三に、横断的相関分析であるため因果関係の確定には限界がある。また、現在はテキストモダリティのみを対象としており、画像・動画については別途研究が必要とされている。著者らは、ディープフェイク映像は視覚的証拠に対するより直接的な脅威をもたらし、写真ドキュメンタリーへの歴史的な信頼感から、より内臓的な形の真実崩壊を引き起こしうると指摘する。
今後の課題として、将来的に事実精度が再帰的学習フィードバックループによって劣化するかどうかの継続的モニタリング、マルチモーダルコンテンツへの同様の大規模研究、そして選挙など特定のコンテキストにおける偽情報の意図的拡散と経済的動機によるAIコンテンツの汎用的普及を峻別するための研究枠組みの開発が挙げられている。最後の課題——環境的なAI汚染と標的型影響操作の区別——は、FIMI研究にとって今後ますます重要な方法論的問いになるだろう。
本論文が提供する最大の貢献は、「AIがインターネットに悪影響を与えている」という広く共有された信念体系を、仮説ごとに分解して実証的に検証したことにある。結果は複雑で、一括した肯定も否定もできない。事実誤りや文体的均質化は現時点では統計的に証明できないが、意味的収縮とポジティブ化シフトは確認された。この非対称な結果は、AIの「悪影響」を単一の現象として論じることの危険性を示している。偽情報研究の文脈でも、「AIが偽情報を増やしているか」という問いは「どのような次元で、どのような測定によって」という方法論的精緻化なしには実証的に答えられない、と本研究は示唆している。

コメント