接着剤ピザから医療被害まで〜 Google AI に対する分かれる評価

[レベル: 上級]

この記事では、Google の AI Overviews の進化と安全性について、著しく異なる視点を示す 2 つの報道を紹介します。
年末年始に公開されたものです。

ひとつは IBTimes が掲載した記事で、AI Overvies が生成する危険な誤情報を強調しています。
もうひとつは Business Insider が掲載した記事で、AI Overviews の段階的な改善と実用性に焦点を当てています。

AIO のリスクと誤情報に焦点を当てた IBTimes UK

IBTimes UK の記事は、Google の AI Overviews を、特に深刻な健康情報に関して、危険なほど誤っていると位置づけています。
AI が文脈を根本的に理解できていないことを強調し、それが命に関わる誤りにつながり得るとして批判しています。

批判の主要点は次のとおりです。

医療上の不正確さ： AI が、膵臓がん患者に対して、（生存に不可欠である場合もある）高脂肪食品を避けるよう助言したり、重要な肝機能検査の結果を誤って「正常」と解釈したりしたと報告されている。
ファクトチェックの欠如： アナリストは、このシステムが検証済みの正確性よりも一般的な回答を優先していると指摘しており、その結果、人気のある誤情報が増幅される「ゴミ入力、ゴミ出力」の状態になっているとしている。
日常的・歴史的な誤り： 健康分野以外でも、誤った空港ターミナルの案内といった旅行情報のミスや、「処女王 (The Virgin Queen)」の称号を持つエリザベス 1 世が妊娠していたと主張するなどの歴史的な大失態が報告されている。
コミュニティからの反発： 誤情報の深刻さから、一部の患者コミュニティは修正を求めるキャンペーンを行うに至り、他のユーザーは代替の検索エンジンに切り替えたり、AI 機能を無効化する回避策を用いたりしている。

AI Overviews に対する IBTimes UK の現状の評価は「コミュニティの抗議を招く危険なツール」です。

AIO の成長と実用性に焦点を当てた Business Insider

対照的に、Business Insider の記事は、AI Overviews の出だしは不安定だったことを認めつつも、2025 年後半までに技術が大幅に改善したと主張しています。
かつて批判者だった筆者自身も、今では従来の検索の代わりに AI Overviews を頻繁に使っていると認めているほどです。

改善評価の主要点は次のとおりです。

「グルー・ピザ」の遺産：チーズがずれないようにピザソースに接着剤を加えることを 2024 年に AI が推奨したという、当時の「インターネット上の悪名」を振り返る。この誤りは、Reddit 上のジョークから拾われたものだったとされる。
ナンセンスへの対応力向上：以前は、AI が架空の慣用句（例：you can’t fit a duck in a pencil「アヒルを鉛筆に入れることはできない」）を説明しようとしていたが、新しいバージョンでは、それらを事実ではなく「一般的ではない」あるいは「遊び心のある」表現として認識する能力が向上している。
ユーザーの適応： システムが「笑ってしまうほどひどい状態ではなくなる」につれ、ユーザー側も AI が効果的に処理できる質問を予測するのが上手くなっていると筆者は述べている。
Google の擁護： Google の担当者は、初期の失敗の多くは、AI が参照できるウェブ上のコンテンツが限られているなかで、ユーザーが誤った前提に基づく検索を行った場合に発生していたと説明している。

AI Overviews に対する Business Insider の現状の評価は「ユーザーが利用するようになっている有用なツール」です。

IBTimes UK が、AI が複数の情報源を寄せ集める傾向によって実際の知性が存在しないと警告する一方で、Business Insider は、この技術が、うまくいかないことよりも、うまく機能することの方が多いツールへと成熟しつつあると好評価しています。

僕は個人的には、ハルシネーションがありうることを理解したうえで　AI Overviews を参照しているつもりです。
AI Overviews に対するあなたの評価はどういったものでしょうか？