Google、AI生成のタイトルリンクを検索結果でテスト中

[レベル: 中級]

Google は、通常の検索結果のタイトルリンクにおいて、パブリッシャーが書いた見出しの一部を AI によって生成された別のタイトルに置き換えるテストを実行しています。

AI 生成タイトルリンク

検索結果のタイトルリンクを AI が生成したタイトルで Google が書き換えている状況を、The Verge のシニアエディター、Sean Hollister(ショーン・ホリスター)氏が発見しました。

タイトルリンクの生成には、<title> 要素内のテキストのほか、<h1> 要素などの見出し要素やアンカーテキストなど複数の要素を利用します。
しかし、どの要素にも当てはまらないタイトルリンクが検索結果に表示されていたようです。

The Verge に対して Google は、AI でタイトルリンクを生成する実験を行っていることは事実だと認めています。

不適切な書き換え

Google が、書き換えたタイトルリンクが元の記事のニュアンスを変えたり、意図していない内容を示唆していたりする例があることを The Verge は懸念しています。

一例として、AI を使ったカンニングツールを批判的に取り上げた見出しの

I used the “cheat on everything” AI tool and it didn’t help me cheat on anything
(「何でもカンニングできる」AI ツールを使ってみたが、何もカンニングできなかった)

が、わずか 5 語の

“Cheat on everything” AI tool

(『何でもカンニングできる』AI ツール)

に短縮され、The Verge が推奨していない製品を肯定しているかのような印象を与えるものになっていました。

もう 1 つの例では、ある記事の見出しが

Copilot Changes: Marketing Teams at it Again
(Copilot の変更点:またもやマーケティングチームの仕業)

に変えられていました。

各単語の先頭が大文字になっています。
これは書き換えられているばかりでなく、The Verge の編集スタイルにも違反しているとのことです。

実験に生成 AI が関与しているが正式版では利用しない

Google は The Verge に対し、このテストはニュースパブリッシャーに限定したものではなく、検索におけるタイトル全般に広く適用されると説明しました。
ユーザーのクエリにタイトルをより適合させ、ウェブコンテンツへのエンゲージメントを向上させることを目的としているとのことです。

また Google は、実験自体には現在生成 AI を使用していることを認める一方で、実際に導入される製品版では AI は使用せずに異なる仕組みで動作する可能性があるとも述べています。

矛盾しているように聞こえます。
しかし、生成 AI を使わずにどのようにタイトルを置き換えるかについては Google は説明しなかったそうです。

整理すると、次のような区別があるようです。

  • 現在(テスト段階): Google は、書き換えられたタイトルが検索パフォーマンスを向上させるかどうかを検証するために、生成モデルを使用している。
  • 将来(導入された場合): Google は、その生成システムをそのまま提供することはない。代わりに、別のタイトルを選択または構築するために、より制約のある手法を使用する可能性がある。

アイディアを迅速にテストするために、実験中に生成 AI を使用している可能性があります。
こうしたことは珍しくないようです。
生成モデルを大規模に運用するには多大なコストがかかるため、小規模な実験でそれらを使用しつつ、より安価で制約のある本番手法を計画するのです。

また、実運用バージョンでは、自由形式のテキスト生成ではなく、ルール、ランキング システム、またはページ要素からのより洗練された抽出方法が使用される可能性もあります。

Google は以前から、既存のページ要素(<title> タグ、 <h1> 、アンカーテキストなど)からタイトルを選択するためにアルゴリズムを使用してきました。
本番システムは、新しいテキストを生成するのではなく、ページ上の既存のテキストの中からよりスマートに選択を行えるようになるのかもしれません。

法的・評判面での距離感による事情も考えられます。

「生成 AI の実験を行っている」ということと、「検索結果に生成 AI による見出しを導入を決定する」ことは、法的責任や PR の観点から見て、特に Vox Media(The Verge の主体企業) との継続中の訴訟や広範なパブリッシャーの懸念を考慮すると、まったく異なる声明です。
Google の広報担当者は、単に技術的な区別をしているだけでなく、意図的にその境界線を引こうとしていた可能性も考えられます。

◇◇◇

いずれにせよ、Google がすでにパブリッシャーによって書かれたものではない書き換え済みのタイトルを表示している以上、パブリッシャーの視点からすれば、たいした違いはありません。
置き換えられた内容が生成モデルによるものか、テンプレート システムによるものか、あるいは他のアルゴリズムによるものかにかかわらず、実際の結果は同じです。
すなわち、Google が検索結果の見出しを改変しているという事実です。

Discover では、AI による見出し生成が導入されています。

Discover で散見される不適切な AI 見出し生成が検索結果で発生しないことを祈ります。

Discover見出し書き換え