AIによる「本物」認定も「偽物」認定も信頼できない――NewsGuardが主要5ツールの検出精度を実証評価

　NewsGuard（ニューズガード）が2026年5月11日に公表した監査レポートは、EDMO（欧州デジタルメディア観測所）のイタリア・ハブであるIDMO（イタリアン・デジタル・メディア・オブザーバトリー）を通じて配信された。著者はいずれもNewsGuardのアナリストであるIsis Blachez、Sofia Rubinson、Ines Chomnalez、監修はDina ContiniとEric Effronが担当している。本稿は、このNewsGuard監査の内容を詳述する。

　EDMOはイタリアの研究機関Luissや公共放送Rai、通信大手TIM、通信社ANSA、そしてNewsGuardを含む複数のパートナーが参加するEU共同出資のプロジェクトである。NewsGuardは商業的なメディア信頼性格付けサービスを提供する企業であり、本稿で取り上げる監査はNewsGuardが自社の調査として実施したものである。この点は評価上の留意事項として最初に明示しておく。

問題の非対称性：偽物の見落としより深刻な「本物の誤判定」

　AIが生成した画像をAIが正しく検出できないケース――いわゆる偽陰性（False Negative）――は、研究者やファクトチェッカーの間でよく知られた問題として認識されてきた。だがNewsGuardの監査が焦点を当てたのは、それとは逆方向の欠陥である。主要な検出ツールが、人間が撮影した本物の写真を「AIが生成した偽物」と誤判定するという偽陽性（False Positive）の問題だ。

　この誤判定が持つ情報操作上の含意は直接的だ。悪意ある行為者が検出ツールの結果を「証拠」として提示し、本物の画像の信憑性を攻撃する手段として利用できる。真正なジャーナリズム映像が「AI生成」と判定された瞬間、その判定結果は偽情報キャンペーンの武器に転化する。武力紛争という検証困難な状況下では、視覚的証拠の信憑性をめぐる争いが情報空間の支配と直結するため、このベクターは特に脆弱である。NewsGuardはすでに別の分析において、米イラン戦争をめぐる偽情報でイラン支持のコンテンツが視覚的な虚偽主張によってソーシャルメディア上で多大なインプレッションを獲得していたことを報告しており、本監査はその文脈に位置づけられる。

監査の設計：米イラン戦争報道画像を素材に

　NewsGuardが監査を実施したのは2026年4月末から5月初旬にかけてで、2026年の米イラン戦争に関連する報道写真15枚を検証素材として使用した。画像の出典はReuters、Associated Press、The New York Times、The Guardian、Google Earthの衛星画像など、信頼性が確立された報道機関・サービスに限定した。

　これら15枚の「本物」画像に加え、各画像をAIツールで二種類の方法で改変した。

軽微な改変：OpenAI ChatGPT、Google Gemini、xAI Grokのいずれかを使い、「照明を改善し、背景の不要な要素をぼかす」というプロンプトで処理した画像
重大な改変：画像の意味を根本的に変える改変を施した画像。「ミサイルが船に命中して沈没する様子を現実的に描写せよ」「原子力施設が破壊されたかのように煙を追加せよ」「旗を変更してイスラエルで撮影されたように見せよ」「イランが運航する航空機に見えるよう機体の文字と旗を変更せよ」などのプロンプトを使用した。

　改変ツールはChatGPTで5枚、Geminiで5枚、Grokで5枚を処理した。Geminiによる改変画像はウォーターマーク除去のためトリミングを施した。計45枚（本物15、軽微改変15、重大改変15）を、Hive、AI or Not、ZeroGPT、Sightengine、ScamAIの5ツールにそれぞれ投入した。判定閾値は確率50%以上をAI生成とする設定を統一的に採用し、各ツールは無料版または最低価格のプランで使用した。

本物画像の誤判定率：ツール間で最大6倍の差

　本物画像に対する偽陽性率の比較が本監査の主要な発見である。

ツール	本物15枚中の誤判定数	偽陽性率
ScamAI	6枚	40%
ZeroGPT	3枚	20%
AI or Not	1枚	6.67%
Hive	0枚	0%
Sightengine	0枚	0%

　5ツール合計の平均偽陽性率は13.33%に達した。業界最高水準の精度を自称するScamAIが最悪の成績を記録し、本物画像のうち6枚すなわち40%をAI生成と誤判定した。ZeroGPTは3枚（20%）、AI or Notは1枚（6.67%）を誤判定した。HiveとSightengineは15枚すべてを正しく本物と判定した。

　各社の反応も監査に記録されている。ScamAI共同創業者のDennis Ngは2026年5月6日のビデオインタビューで偽陽性の発生を認め、検出ツールが本物画像を正しく識別するには高解像度と十分なピクセル数が必要であると説明した。なお、ScamAIのウェブサイトには「コンテンツタイプや攻撃手法によって精度は異なる」と記載されており、「95.3%の検出精度」を達成しているとも主張している。ZeroGPT CEOのRawad Baroudは5月6日のメールで、画像のリサイズや圧縮といった処理が誤判定を招くこと、また紛争地帯の報道写真に特有の不自然な照明、強いコントラスト、ぼかしなどの特徴がAI生成画像に酷似するため誤判定が生じると述べた。AI or Not CEOのAnatoly Kvitnitksy（5月7日のメール）は、低解像度が偽陽性の一因になり得ると説明した。

重大改変画像の検出率：今度は逆の問題が顕在化

　同じ5ツールが「意味を根本的に変える改変」が施された画像をどれだけ検出できたかについては、結果の順位が逆転した。

ツール	重大改変15枚中の検出数	検出率
AI or Not	15枚	100%
ZeroGPT	14枚	93.33%
ScamAI	12枚	80%
Hive	9枚	73.33%
Sightengine	5枚	33%

　本物画像を完全に正判定したHiveとSightengineが、重大改変画像の検出では最低水準に落ち込んだ。Sightengineは重大改変画像の33%しか検出できなかった。この対比は、「偽陽性率が低い＝偽陰性率も低い」という単純な相関が成立しないことを示している。SightengineのファウンダーであるDavid Lissmyrは、同社の基本モデルは「完全にAIで生成された、あるいは大幅に改変された画像を識別するよう設計されている」と説明し、軽微な改変を検出する高度なモデルも別に提供していると述べた。

軽微改変画像への反応：ScamAIは93%をAI生成と判定

　照明調整や背景ぼかし程度の「軽微な改変」を加えた画像に対して、各ツールがAI生成と判定した割合は以下の通りとなった。

ツール	軽微改変15枚中のAI生成判定率
ScamAI	93%
AI or Not	87%
ZeroGPT	80%
Hive	27%
Sightengine	27%

　同一の画像セットに対して27%から93%という6倍近い幅が生じた。ScamAI CEOのNgは、軽微なフィルターであっても「合成操作の痕跡を残す」ためAI生成と分類すると説明した。この判定方針は、報道用途での軽微な画像処理（ホワイトバランス調整、シャープネス、圧縮アーティファクト除去など）が日常的に施された写真を軒並みAI生成と判定するリスクをはらんでいる。

ツール間の不一致：45件中35件で見解が分かれた

　5ツールが同一画像に対して同じ結論を出したケースは全45件中10件にとどまった。35件（78%）で少なくとも1ツールが他と異なる判定を下した。この不一致は、複数のツールを参照して「より確かな判断」を得ようとする一般的なユーザーの行動が、むしろ混乱を拡大させる可能性を示している。

　イランの弾道ミサイルの画像に「No Kings」という文字をAIで追加した改変画像（NewsGuardはこれが反トランプ抗議と絡めてフィロ・イラン系アカウントに数百万インプレッションをもたらした事例を既報している）に対しては、3ツールがAI生成と判定し、2ツールが本物と判定した。同じく、レバノンでの支援物資配布を撮影した画像の改変版に対しても、ツールによって判定が真っ二つに割れた。

ネタニヤフ動画問題：検出ツールの悪用という実例

　本監査が挙げる最も具体的なケーススタディは、2026年の米イラン戦争中にイスラエル首相ベンヤミン・ネタニヤフがカフェでコーヒーを飲む様子を撮影した動画をめぐるものだ。この動画は、ネタニヤフがイランのミサイル攻撃で死亡または重傷を負ったとする噂に対して生存を証明する目的で公開されたものである。

　ところが、一部のユーザーがこの動画をHiveの分析結果とともに投稿し、「AIによって生成された確率96.9%」という判定を「ネタニヤフは実際に死亡している証拠」として流布した。NewsGuardによれば、同動画が撮影された店舗の他の画像・動画との照合によって動画の真正性は確認されており、Hiveが誤判定した原因は動画に施された軽微なフィルターまたは背景のわずかなぼかし処理であったと推測される。Hiveはこの件に関するNewsGuardからの2通のコメント要請に回答しなかった。

　このケースは、検出ツールの偽陽性が単なる技術的な誤りにとどまらず、情報操作のインフラとして積極的に活用されることを実証的に示している。悪意ある行為者は「ツールがAI生成と言っている」という外形的な権威を利用して本物の映像の信頼性を破壊できる。

精度主張と実測値のギャップ

　5社それぞれが自社ウェブサイトで高い検出精度を主張しているが、その根拠と測定条件は一様ではない。AI or Notは「98.9%の検出精度」を標榜するが、これは公開された学術データセットに基づく自社評価によるものだ。ScamAIは「95.3%の検出精度」を主張するが、「コンテンツタイプや攻撃手法によって精度は異なる」という免責事項も並記している。ZeroGPTは画像検出ツールの精度を開示していない。HiveはNewsGuardの質問に回答しなかったが、ウェブサイトでは「2024年の独立研究で競合モデルや人間の専門家の分析を上回った」と主張している。Sightengineはロチェスター大学とカンザス大学の研究を引用し「最高精度」を謳っている。

　これらの主張が実際の運用条件（報道写真、圧縮処理、軽微な編集が施された素材）と乖離している点は、検出ツールのベンチマーク評価が学術的な統制環境に基づいていることの限界を示唆する。ZeroGPT CEOのBaroudは「AIの検出結果は、情報源の検証、逆画像検索、メタデータ分析、公開タイムライン、ジャーナリスティックなコンテクストと組み合わせて使うよう」ジャーナリスト、研究者、ファクトチェッカーに呼びかけた。

分析上の含意

　本監査が明らかにした問題は三層構造をなす。第一層は技術的問題であり、同一の画像セットに対してツールの判定が78%の割合で不一致となる事実は、これらのツールが「何をもってAI生成とみなすか」について産業横断的なコンセンサスが存在しないことを示している。各ツールが内部で使用する判定閾値の設計思想が根本的に異なっており、その差異がユーザーに対して透明な形で開示されていない。

　第二層は運用リスクである。報道画像には軽微な画像処理が日常的に伴う。JPEG圧縮、ホワイトバランス補正、テレビ放送用の解像度ダウンサンプリングといった標準的な処理が、一部のツールでは「AI操作の痕跡」として誤判定される。これはファクトチェッカーや研究者が、ツールの出力を追加検証なしに信頼することのリスクを意味する。ZeroGPT CEOのBaroudが指摘したように、紛争地帯の報道写真は不自然な照明、強いコントラスト、被写界深度の浅さなど、AI生成画像の統計的特徴と重なる視覚的属性を本質的に持ちやすい。これは技術的な欠陥というより、検出モデルの訓練データと実際の運用文脈の乖離を反映している。

　第三層は情報操作上のリスクである。本監査が示したネタニヤフ動画の事例は偶発的なものではない。偽陽性の判定結果が存在する限り、悪意ある行為者はそれを組織的に活用して真正なコンテンツの信頼性を損なう手段として利用できる。検出ツールの普及は、そのまま操作の機会の普及でもある。ツールが出力する確率値（たとえば「96.9%の確率でAI生成」）は、一般ユーザーに対して科学的客観性の外観を与えるが、その数値はモデルの内部不確実性を反映したものに過ぎず、独立した検証能力を持つ。

　本監査の方法論上の限界も指摘しておく必要がある。各ツールの無料版または最低価格プランのみを使用しており、Sightengineが言及した「軽微改変向けの高度モデル」のような上位機能は評価対象外となっている。また15枚という標本数は統計的堅牢性の観点から限定的であり、米イラン戦争という特定文脈の画像に限定されているため、他の紛争や非戦争状況への一般化には注意が必要だ。それでも本監査の価値は、ツールが商業的に宣伝する「高精度」と、実際の報道映像への適用における誤判定率の間に構造的な乖離があることを、具体的な数値と実例で文書化した点にある。

原文（イタリア語）：https://www.idmo.it/2026/05/11/i-principali-strumenti-di-rilevamento-delle-immagini-ia-ingannano-gli-utenti-online-spesso-classificando-come-false-immagini-autentiche/

EDMO掲載ページ：https://edmo.eu/publications/major-ai-image-detection-tools-deceive-online-users-often-classifying-authentic-images-as-fakes/