生成AIが作る偽情報にどう対処するか――IPIEによる実験的証拠のメタ分析

　2026年、スイスのチューリヒを拠点とする国際情報環境パネル（IPIE: International Panel on the Information Environment）が合成報告書SR2026.2「Confronting Misinformation Produced with Generative AI: A Meta-Analysis of Experimental Scientific Evidence」を公表した。IPIEは偽情報研究・情報環境の科学的評価を専門とする独立国際機関であり、世界各国から数百人の研究者が関与している。本報告書の起草を担当したのは、コンサルティング科学者のAliaksandr Herasimenka（英国）をはじめ、IPIE最高科学責任者のSebastián Valenzuela（チリ）、Shelley Boulianne（カナダ）、Frank Esser（スイス）、Lisa M. Given（カナダ・オーストラリア）、Stephan Lewandowsky（オーストラリア・英国）、Eva M. Navarro-López（スペイン・英国・メキシコ）、Philip N. Howard（IPIE理事長、カナダ・英国）の計8名である。資金提供者の詳細はwww.ipie.infoに開示されており、報告書の意見・結論は必ずしも資金提供者の見解を反映しない。

　本報告書は、生成AI（GenAI）が産出した偽情報の個人への効果と、それを軽減するカウンターメジャーの有効性を、無作為化対照試験（RCT）に基づく実験的証拠のメタ分析によって定量的に評価したものである。分析対象は2018年から2025年にかけて発表された24本の査読済み論文から抽出された60件の効果量推定値であり、参加者総数は33,801人に上る。

IPIEとは何か

　IPIEは、気候変動に関する政府間パネル（IPCC）の情報環境版として位置づけられる独立国際科学機関であり、政策立案者・産業界・市民社会に対して世界の情報環境に関する科学的評価を提供することを使命とする。政策立場にコミットせず実証的根拠の集約・評価に特化する点が特徴である。SR2026.2は同機関の合成報告書シリーズの一部であり、SR2023.1（デジタル偽情報のカウンターメジャーに関するシステマティックレビュー）およびSR2023.2（プラットフォームの偽情報対応に関するメタ分析）を継承・拡張したものである。

リサーチクエスチョンと概念的枠組み

　本報告書は二つのリサーチクエスチョンを設定している。第一（RQ1）は、「GenAIが産出した偽情報への曝露が個人の情報評価にどのような効果をもたらすか、またその効果がコンテンツのモダリティ（テキスト対ビジュアル）・モデルの種類・時間軸によってどう変化するか」である。第二（RQ2）は、「GenAI偽情報に対する個人の評価能力を向上させるうえで最も有効なカウンターメジャーはどれか」である。

　報告書が採用する「偽情報（misinformation）」の定義は意図の有無を問わない包括的なものであり、フェイクニュース・プロパガンダ・デマ・ディープフェイク・AIハルシネーションを含む誤解を招く情報全般を指す。「生成AI」の定義はOxford English Dictionaryに依拠し、「大量データから機械学習によって外挿し、従来は人間の知性を要すると考えられていたテキストや画像などの出力を生成するアルゴリズム・システム・ソフトウェア」とされる。GPT・Geminiなどの大規模言語モデル（LLM）、DALL-E・Midjourneyなどの画像合成モデル、RunwayやSoraなどの動画生成システムが例示されている。

　GenAIが産出した偽情報が非GenAI偽情報よりも説得力があるかどうかは先行研究では一致した結論が得られていないが、GenAIは容易にアクセス可能なツールで大量の誤解を招くテキスト・画像・音声・動画を短時間で産出でき、特定オーディエンスに合わせてカスタマイズし本物の通信を模倣する能力を持つ。この点が研究を急務たらしめている。

方法論：7,000本の文献からRCT 24本へ

　文献検索はScopusとWeb of Scienceの2データベースを対象に実施し、「偽情報」6語と「生成AI」15語（GPT・Gemini・DeepSeek・Claude・LLaMAなど主要モデル名を含む）を組み合わせた。対象期間は2017年1月1日から2025年4月10日であり、加えて2025年7月にIPIE関係者（約450人の研究者）への照会によって12本の追加論文を収集した。

　最終的に重複を除いた6,952本（Scopus：5,777本、Web of Science：3,687本、専門家照会：12本）が初期コーパスを構成した。このコーパスには査読誌論文のほか、書籍章24本、早期公開論文313本、学会議事録318本が含まれる。グレー文献（未査読のプレプリント・発表資料・会議要旨）は体系的なサンプリングが困難であることを理由に除外した。

　適格基準は5項目から構成される。（1）実証的であること（実験的・量的・質的データを含む）、（2）RCTまたは準実験デザインを使用していること、（3）偽情報の側面を主要研究対象としていること、（4）GenAIに関するものであること、（5）GenAI偽情報への曝露効果またはカウンターメジャーの効果を人間被験者に対して報告していること。スクリーニングには3名の研究者が4ラウンドのパイロットコーディングを実施し、最終的なコーディングスキームを確立した。未評価文献の絞り込みにはGoogleのLLMであるGemma 2を検出モデルとして活用したが、LLMの判断誤りによる除外率は1.56%にとどまった。

　87本がタイトル・抄録・キーワードの段階で適格と判定され、全文精読後に24本が最終サンプルに含まれた（除外理由：効果量・標準誤差未報告60件、重複2件、バイアスリスク高1件）。抽出された効果量は合計60件（偽情報効果37件・カウンターメジャー効果23件）であり、これはCocharneガイドラインによればメタ分析に十分な数とされる。

　統計分析ではランダム効果モデルを採用してヘテロジェナイティー（研究間変動）を考慮した効果量の統合を行った。時間的トレンドの検討には3水準ランダム効果メタ回帰（metafor Rパッケージ、最尤推定）を用い、データ収集年月を調整変数として投入した。効果量指標にはHedges’ g（複数研究にわたって標準偏差単位で表された平均差の標準化指標）を使用した。バイアスリスク評価には改訂版ランダム化試験バイアスリスク評価ツール（RoB 2）を適用した。

発見①：テキスト型GenAI偽情報の信憑性は時間とともに上昇している

　テキスト型GenAI偽情報への曝露効果を分析したメタ回帰（2019年から2024年に実施された実験、5論文から抽出した14件の効果量）は、データ収集時期が新しくなるほど効果量が増大するという統計的に有意な正の傾きを示した（β = 0.08、95%信頼区間：[0.02; 0.15]、p = 0.01）。すなわち、より新しい研究ほどテキスト型GenAI偽情報が信頼できる情報と同等か、それ以上の信憑性・正確性を持つと評価されやすい傾向が観察された。研究間の分散は τ²（Level 3）= 0.01・τ²（Level 2）= 0.01であり、総分散の50.10%が論文間の差異に、40.01%が同一論文内の実験間の差異に起因することが示された。

　この傾向を例示する知見としてKreps, McCain, Brundageの研究がある。パラメータ数7億7400万の大型GPT-2が産出した偽情報は、参加者に検証済みコンテンツよりも信憑性が高いと評価された一方、3億5500万パラメータの小型版では同等の効果は得られなかった。この結果はモデル規模と知覚的信憑性の因果関係を確立するものではないが、より複雑な言語モデルが生成するコンテンツがより一貫性・細部描写を持ち得ることと整合する。GPT-4など2020年以降にリリースされたより高性能なモデルの効果量プール推定値は有意（g = 0.28）だが、予測区間に0が含まれており、文脈によって効果が安定して観察されるわけではない。一方、GPT-4を用いた最近の研究ではGenAI産出の偽情報は依然として人間産出の偽情報よりも認識されやすいという結果も報告されており（Bashardoust, Feuerriegel, Shrestha 2024）、一様ではない。

　テキストデータの外れ値はWack, Ehrett, Linvill, Warren（2025）の研究である。他の多くのテキスト実験が実験室で生成したLLM出力を刺激材料として使用したのに対し、この研究はジャーナリズム調査によってLLM産出の可能性が示唆された実世界の偽情報を用いた。ただし、その起源は産出者によって確認できなかった。

発見②：ビジュアル型GenAI偽情報（ディープフェイク）への懐疑は拡大している

　ビジュアル型GenAI偽情報の分析（2020年から2023年に収集されたデータ、10論文から抽出した18件の効果量）は、テキストとは対照的に信憑性知覚が時間とともに有意に低下する傾向を示した（β = -0.22、95%信頼区間：[-0.35; -0.10]、p = 0.0003）。特に2021年以降のデータを対象とした分析では、プール化ランダム効果推定値がg = -0.34（95%信頼区間：[-0.44; -0.24]）と中程度で有意な信憑性低下を示し、予測区間（PI：[-0.64; -0.03]）は全体として負の値にとどまることを示唆した。この知見は政治・文化など複数領域・様々なサンプルサイズの研究にわたって観察された。

　ビジュアルモダリティのヘテロジェナイティーの主な源は論文内実験間の差異であり（I²(Level 2) = 89.73%）、異なる論文間の差異ではなかった（τ²(Level 2) = 0.00）。なおこの結果は論文間ヘテロジェナイティーの非存在を確定的に示すものではないと報告書は注記している。

　個別研究が特定した知見として、情報源への信頼（より信頼できる情報源からと提示されるとディープフェイクを真正と誤信しやすい）、年齢（高齢者は若年者よりディープフェイクに脆弱）、顔の特徴・映像の背景・映像品質などのビジュアル手がかりへの依存（文脈的・社会的要因よりも表面的なビジュアル手がかりを判断材料とする傾向）が、識別の困難さに関係する要因として挙げられている。これらは個別研究の知見であり、本メタ回帰モデルが直接推定したものではない。

　テキストとビジュアルで観察されたこの分岐――テキスト型の信憑性は上昇、ビジュアル型への懐疑は増大――は、GenAIモデルの能力そのものではなくデータ収集時期との関連性として解釈すべきであると報告書は強調する。2020年から2021年は生成AI技術の公開普及における広範な転換点であり、この時期を境に研究のパターンが変化した。

発見③：事前的修正情報は効果が安定している

　カウンターメジャーの第一は、事前的修正情報（preventive corrective information）である。これは偽情報への曝露前に、欺瞞の可能性について警告する予防的教育的前置き（フォアウォーニング）を参加者に提供する介入であり、「アドバイス」や「プライミング」とも呼ばれる。具体的な形態としては、GenAIがエラーを産出しうるという注意喚起、ディープフェイクが現実的な動画操作を可能にすることの説明、GenAIハルシネーションに関する簡潔な教育資料などが含まれる。接種理論（inoculation）やメディアリテラシー教育の下位概念に位置づけられる介入でもある。

　2020年以降に実施されたRCTのみを対象とした分析（4論文から抽出した7件の効果量）では、事前的修正情報への曝露がGenAI産出偽情報の正確性・信頼性・信憑性評価を有意に低下させることが示された（g = -0.30、95%信頼区間：[-0.43; -0.17]、p < 0.0001）。予測区間が0を含まないことは、類似した将来の研究においても負の効果が期待されることを意味し、比較的安定した効果と評価できる。このサブサンプルにおける研究間ヘテロジェナイティーは低く非有意（I² = 22.8%、p = 0.25）であり、事前的修正情報と知覚的信憑性低下の関連が含まれた研究デザインや文脈を横断して一貫していることを示唆する。Egger検定で漏斗プロット非対称性は非有意であり、出版バイアスや小規模研究効果の証拠も観察されなかった。

　含まれた研究の地理的分布はオーストリア・ドイツ・オランダ・英国・韓国・米国であり、参加者はMTurkなどのオンラインプラットフォームを通じて募集された場合が多い。最も多い主題領域は政治的偽情報であり、政治関連研究のサブセットでの効果量推定値は負だが予測区間が0を含む（g = -0.15、95%信頼区間：[-0.28; -0.02]）。

　2020年以前の研究を含む全サンプル分析ではプール効果量は引き続き負（g = -0.22）だが、予測区間が0を含みヘテロジェナイティーが増大する。初期研究の不確実性の一因として、アウトカム操作化の相違が指摘される。2021年以前の研究の多くは、知覚的信憑性・正確性ではなく偽情報の「検出」能力を従属変数としており、この分類で結果は混在する。検出能力の向上よりも外部の認証ソースへの信頼を促進するほうが効果的という議論もあり、検出と評価的判断の概念的区別が重要な意味を持つ。ある初期ディープフェイク研究では修正情報への曝露が参加者を本物の映像・操作済み映像の両方への不信につながったことも報告されており（Ternovski, Kalla, Aronow 2022）、修正情報が過剰警戒を誘発するリスクも示されている。

　以下に本サブサンプル（post-2020）における主要研究の概要を示す。

著者・年	サンプル	モデル	形式	介入	g
Hwang and Jeong 2025	208	未特定テキスト	テキスト	フォアウォーニング	-0.45
Hwang and Jeong 2025	208	未特定テキスト	テキスト	フォアウォーニング	-0.45
Spearing et al. 2025	200	GPT-3.5	テキスト	フォアウォーニング	-0.43
Bray et al. 2023	154	その他ビジュアル	混合画像	包括的フォアウォーニング	-0.32
Shin and Lee 2022	139	Faceswap	動画	包括的フォアウォーニング	-0.23
Spearing et al. 2025	200	GPT-3.5	テキスト	フォアウォーニング	-0.07
Bray et al. 2023	137	その他ビジュアル	混合画像	包括的親しみづけ	-0.06

発見④：コンテンツラベリングは平均的に有効だがヘテロジェナイティーが大きい

　カウンターメジャーの第二はコンテンツラベリング（content labeling）である。これは情報が誤解を招く可能性があること、またはAIによって生成されたことを示す簡潔なビジュアル・テキスト・マルチモーダルなタグを情報に付加するものであり、自動生成・モデレーター生成・ユーザー生成のいずれの場合もある。先行研究で検証されたラベルの例としては「AI生成」（人工知能を用いて生成されたメディア）、「人工的」（編集またはデジタル的に改変された人工コンテンツ）、「虚偽情報。この投稿は独立したファクトチェッカーによって審査されました」などがある。事前的修正情報と異なり、ラベリングは教育的・スキル構築的な介入というよりは直接的な警告として機能する。多くの研究ではラベルは曝露前後に提示されているが、初期曝露後に遡及的に付与するラベリングを検証した研究も存在する。

　4論文から抽出した7件の効果量のランダム効果メタ分析では、コンテンツラベルの付加がGenAI産出偽情報の知覚的信憑性を小幅だが有意に低下させることが示された（g = -0.24、95%信頼区間：[-0.33; -0.15]、p < 0.001）。出版バイアス調整後も推定値は安定している（g = -0.25、95%信頼区間：[-0.35; -0.16]、p < 0.001）。ただし研究間ヘテロジェナイティーは実質的に大きく（I² = 48.4%）、予測区間が0に接近しており、一部の文脈ではラベリング介入が知覚的信憑性を安定的に低下させない可能性を示唆する。

　ラベルの種類による効果の差異として、ある研究（Wittenberg et al. 2025）は画像に付加したラベルにおいて「AI生成」ラベルが「操作」「改変」といったラベルよりも効果が小さいことを報告している。画像対象研究はテキスト対象研究よりも大きな負の効果を報告する傾向があるが、これは記述的観察であり正式な分析に基づくものではない。ヘテロジェナイティーを増大させた研究として、ジョー・バイデン前大統領をフィーチャーしたパロディディープフェイクを素材とした研究（Appendix B Publication 16）があり、著者自身がディープフェイクのスタイルや対象人物の個性がアウトカムに影響したと認めている。このサブサンプルの参加者はほぼ米国に集中しており、一般化可能性は限定的である。

　以下に含まれた研究の概要を示す。

著者・年	サンプル	モデル	形式	ラベル種別	g
Lee and Shin 2022	245	Faceswap	動画・画像	遡及的AIラベル	-0.48
Wittenberg et al. 2025	4,160	その他ビジュアル	画像	AI・虚偽ラベル	-0.34
Wittenberg et al. 2025	4,188	その他ビジュアル	画像	AI・虚偽ラベル	-0.25
Spearing et al. 2025	200	GPT-3.5	テキスト	遡及的AIラベル	-0.23
Lu and Yuan 2024	426	その他ビジュアル	動画	AIラベル	-0.19
Lu and Yuan 2024	438	その他ビジュアル	動画	AIラベル	-0.07
Spearing et al. 2025	200	GPT-3.5	テキスト	遡及的AIラベル	-0.07

効果量の解釈：統計的な「小」が現実的に意味すること

　報告書はCohenの基準（小：約0.2 SD、中：約0.5 SD）に照らして効果量の解釈を行っている。事前的修正情報（g = 0.30）とラベリング（g = 0.24）の効果量はいずれも「小」と「中」の間に位置する。しかし報告書は絶対視への注意を促し、効果の大小はフィールドと方法論の文脈内で判断すべきだと論じる。10億ユーザーのプラットフォームにおける0.3 SDの偽情報信憑性低下は実践的に巨大なインパクトを持ちうる。

　テキスト型偽情報の知覚的信憑性上昇に関する時間係数（β = 0.08）は保守的な推定値でもある。今回レビューした実験の大多数が静的なメッセージへの曝露を検討したのに対し、最近の知見（Hackenburg et al. 2025、Science誌）は生成AIとの対話型チャットが静的メッセージよりも約50%説得力が高い可能性を示唆しており、会話型GenAIシステムによる偽情報の説得効果はメタ分析の推定をはるかに上回る可能性がある。

限界と証拠基盤の制約

　報告書は複数の方法論的・実証的限界を率直に提示している。第一に、いくつかのプール化効果量は最大でも7件の推定値に基づいており、メタ回帰の統計的検出力が低い。テキスト型偽情報のメタ回帰は14〜18件の推定値・5〜10の一次研究に基づくものであり、推奨される最小基準（30件以上の効果量・10本以上の一次研究）を下回る。第二に、地理的集中の問題がある。分析の大半が西欧・北米の文脈に集中しており、ビジュアル型偽情報サブサンプルでは例外的な1研究を除き全研究が米国・EUの参加者を対象としている。5件の非英語アブストラクトを評価したが適格基準を満たすものはなく、英語文献に限定されている。第三に、RCT中心のレビューが捉えられる範囲の問題がある。RCTはGenAI偽情報との日常的経験の複雑さを反映しない可能性があり、質的・観察的研究との統合が今後必要である。第四に、コンテンツラベリングサブサンプルの高ヘテロジェナイティー（I² = 48.8%）は、ラベルの存在よりもラベルの付け方の詳細が効果を規定することを示唆するが、この異質性の因果的源泉を特定するには至っていない。

政策的含意

　報告書が導く政策勧告は四点に集約される。第一に、テキスト型GenAI偽情報を政策対応の優先事項とすること。テキスト型偽情報はすでに高い信憑性で知覚されており、対話型GenAIシステムの普及とあいまって最も即時的かつスケーラブルな危害源になりうる。規制的保護手段は明示的に会話型GenAIシステムへと拡張されるべきである。第二に、事前的修正情報をコア介入として位置づけること。複数の実験的文脈において効果が確認されており、気候変動・公衆衛生・選挙などリスクの高い領域において、リーチの広いプラットフォームやGenAIシステムへの事前的修正情報の組み込みを義務化または強く奨励すべきである。第三に、コンテンツラベリングは継続的な評価を要する有望な手段として位置づけること。効果はラベルの種類・提示方法・コンテンツ形式・文脈によって大きく異なるため、規制的枠組みはこの戦略の反復的なテストと改良を奨励すべきである。第四に、独立した評価と証拠統合への投資が必要であること。現在の証拠は不完全であり、協調的な学際研究・再現研究・定期的な証拠レビューの更新を支援する政策的コミットメントが、ガバナンスアプローチを実証的根拠に合致させ続けるために不可欠である。

報告書情報

正式タイトル：Confronting Misinformation Produced with Generative AI: A Meta-Analysis of Experimental Scientific Evidence
発行：International Panel on the Information Environment (IPIE)
報告書番号：SR2026.2
DOI：10.61452/UGTR3022
発行地：チューリヒ、スイス、2026年