ChatGPTやGeminiなどの主要AIアシスタントで“重大な誤答”｜検証から見えたリスクと課題

2025年10月31日

生成AIの進化によって、ニュースの要約や事実確認といった高度なタスクも瞬時に行えるようになりました。しかしその一方で、報道に関する質問に対してAIが重大な誤答を繰り返しているという調査結果が相次いでいます。出典の捏造、事実誤認、文脈の誤解など、見過ごせない問題が各所で浮き彫りになっています。

そこで今回は、主要AIアシスタントによる誤答の実態とその原因、さらにそれがもたらす社会的リスクについて検証します。AIとの適切な付き合い方を考えるうえでの参考にしてみてください。

AIアシスタントの誤答率が問題視された背景

生成AIの活用が進むなかで、その出力の正確性に対する疑問の声が高まっています。ここでは、こうした誤答が問題視されるようになった背景について解説します。

AIが報道に関する質問に重大な誤答を繰り返すことが判明した

AIが報道に関する質問に重大な誤答を繰り返していることが、BBCなどの調査で明らかになりました。BBCでは4つの主要AIに対し100件のニュース記事の要約を依頼し、その結果、重大な問題が含まれていたと報告しています。特に事実誤認が顕著だった例として、以下のような出力が確認されました。

NHSが「電子タバコを推奨しない」と発言したと記述（実際は推奨）
すでに暗殺されたハマス指導者が現役と説明
辞任済みの首相が在任中のように記載
有罪が確定した被告について「判断は個人次第」と表現

AIは事実と意見の混同や文脈の誤解も多く、BBCは「生成AIツールは火遊びをしている」と警鐘を鳴らしました。

NewsGuardによる調査で45%の回答に重大な誤りがあった

NewsGuardと世界22の公共放送局が合同で行った大規模調査により、主要なAIチャットボットによるニュース回答の45%に重大な誤りが含まれていることが判明しました。この調査はChatGPT、Copilot、Gemini、Perplexity AIの4種を対象とし、3,000件以上の質問に対する回答の正確性や情報源の明示性などが検証されました。

特に深刻な問題として、次のような傾向が浮かび上がっています。

回答の45%に、誤情報や偏向などの重大な不正確性が含まれていた
回答の31%で、出典が未提示または捏造されていた
回答の20%に、完全な事実誤認が含まれていた

なかでもGoogleのGeminiは、72%の回答に出典不備の問題があると評価されています。こうした誤りは一過性のミスではなく、欧州放送連合が「構造的欠陥」と指摘するように、言語や地域を問わず繰り返されていることが問題視されています。

AIアシスタントはなぜ誤答するのか？

生成AIの回答に誤りが含まれる事例が各所で報告されていますが、そもそもなぜAIは誤った情報を出力してしまうのでしょうか。ここでは、AIアシスタントが誤答をしてしまう仕組みや背景について解説します。

AIは情報源の真偽を判断できないため誤情報を引用してしまうため

生成AIは、言葉の意味や事実の正誤を理解しているわけではなく、膨大なデータから文脈上自然に見える表現を確率的に組み立てています。この特性により、情報源が不正確であっても見抜くことができず、誤った内容をあたかも正しい情報のように提示する恐れがあります。

インターネット上には事実と異なる噂や個人の誤解に基づく情報も多く、AIがそれらを参照する例も少なくありません。出力された情報をそのまま鵜呑みにすると、誤認による判断ミスや行動の誤りにつながるリスクが高まります。

言語モデル特有の幻覚（ハルシネーション）が発生するため

大規模言語モデル（LLM）は、情報を記憶しているわけではなく、統計的にもっともらしい単語の並びを予測しながら文章を生成します。この仕組みにより、事実と異なる内容でも、整合性のある自然な表現として出力してしまうことがあります。これが「ハルシネーション（幻覚）」と呼ばれる現象です。

特に、実在しない情報を事実のように提示したり、文脈とずれた回答が生成されたりするため、内容の真偽を見極めずに信じることは危険といえます。

以下は、主なハルシネーションの分類です。

種類	内容
事実ハルシネーション	実在しない出来事や人物を、事実として提示する
文脈ハルシネーション	質問の意図や流れを誤解し、関係の薄い内容を回答する
構造ハルシネーション	不適切な形式や構造で文章を生成し、読み手の期待と乖離した表現になる
創造的ハルシネーション	架空の理論や用語を新たに作り出し、現実の情報と混在させてしまう

質問の文脈や誘導表現により誤った内容を補強してしまうため

生成AIは質問の文脈に大きく依存して出力を構築するため、問いに誤った前提が含まれている場合でも、それを肯定するような応答を導きやすくなります。たとえば、歴史上の人物に関する質問で年代が異なっていても、その齟齬を指摘せず、あたかも正しい情報であるかのように話を進めてしまうことがあります。

これは、AIが「正確な事実を検証する機能」ではなく、「もっともらしく見える文章を構成する能力」に基づいて動作しているためです。さらに、誘導的な表現を含む質問に対しても、その意図に沿って回答を生成しやすく、誤った情報を補強する結果となる場合があります。

AIは「自然な文章の生成」を優先「事実の正確性」を確認しない設計になっているため

生成AIは、人間のように意味や真偽を理解して文章を構築しているわけではなく、膨大な学習データをもとにもっとも自然に続く語句を確率的に選んで文章を生成しています。そのため、文脈としては自然でも、実際とは異なる情報が出力されることがあります。

これは欠陥ではなく、「自然な言語表現の生成」を重視した設計によるものです。言い換えれば、正確性を検証する機能は前提として備わっていません。こうした特性を理解せずに出力内容を無条件に信頼すると、誤情報の拡散や意思決定の誤りにつながるおそれがあります。

AIの誤答がもたらすリスクと影響

生成AIが出力した誤情報は、SNSや報道を通じて瞬く間に拡散されるおそれがあり、個人・企業・社会全体に深刻な影響を与えるリスクがあります。ここでは、AIの誤答が引き起こす具体的なリスクと影響について解説します。

誤情報がSNSやメディアを通じて拡散するリスクがある

生成AIによる誤情報は、SNSやニュースメディアを通じて瞬く間に広がる危険があります。特にAIが自然な文体で生成した文章や画像は信憑性が高く見えるため、多くの人が内容を事実として受け止めてしまう傾向にあります。その結果、誤情報が拡散すると個人や企業の信用を損ね、社会的な混乱を招くおそれがあります。企業に関する誤情報が広がった場合には、次のような深刻な影響が生じる可能性があります。

ブランドイメージの毀損：虚偽の情報がSNSで炎上し、信頼を大きく失う
ビジネスチャンスの喪失：誤った製品情報が流れ、購買や契約が見送られる
サポート業務の逼迫：存在しない機能や価格への問い合わせが急増する

このような被害を防ぐには、生成AIの出力内容を鵜呑みにせず、ファクトチェック体制を整えることが重要です。また、誤情報が広がった際には迅速に訂正情報を発信し、正確な内容を周知させることが求められます。

教育・報道・医療など正確性が求められる分野で誤用の危険がある

AIが誤った情報を生成した場合、正確性が強く求められる教育・報道・医療の分野では、その影響が極めて深刻になるおそれがあります。たとえば教育現場では、生成AIが出力した誤答を生徒がそのまま課題に使用し、学習の質や評価の公平性が損なわれる事例が実際に発生しています。医療の分野においても、実在する医学誌を装った偽の引用を含む誤情報が生成

されることで、誤診や不適切な治療判断につながるリスクが懸念される状況です。

以下に、分野ごとの代表的なリスクと想定される影響を整理します。

分野	主なリスクの例	想定される影響
教育	AIの誤答をそのまま学習に使用	誤学習、思考力の低下
報道	虚偽の情報に基づく記事の執筆や拡散	誤報による世論形成、風評被害
医療	偽引用による誤情報の生成	患者の健康被害、訴訟リスク

さらに、個人ユーザーや業務担当者がAIの誤答を信じたことで損害を被るケースもあります。たとえば以下のような被害が懸念されます。

誤った健康情報を信じて適切でないサプリを購入する
架空の判例を引用して法務資料を作成し、信用を損なう
虚偽の統計をもとに経営判断を行い、企業が損失を被る

このように、AIの誤情報は学習や報道の質を損ない、信頼や安全を脅かす可能性があります。AIの出力は必ずしも事実に基づいているとは限らないため、出力内容をそのまま受け入れず、慎重にファクトチェックを行う姿勢が大切です。

まとめ：AIの誤答リスクを理解し、賢く活用しよう

AIアシスタントは便利な存在である一方で、報道や医療など正確性が求められる分野において重大な誤答を出力するリスクも抱えています。調査では、AIの回答の約半数に誤情報や出典不備が含まれており、これがSNSや業務を通じて拡散・信頼失墜につながる事例も報告されています。

背景には、AIが情報の真偽を判断できないこと、文脈や誘導に弱いこと、そして自然な文章生成を優先する構造があると指摘されています。AIの特性と限界を正しく理解し、出力された内容をそのまま鵜呑みにせず、必ずファクトチェックを行う姿勢が不可欠です。利便性とリスクの両面を踏まえ、AIを賢く使いこなしていきましょう。