Google検索インフラへのAI統合、GEOもAIOも必要ない — #SearchCentralLive Tokyo 2025 より

[レベル: 中級]

この記事では、2025 年 11 月 7 日に Google 東京オフィスで開催された Search Central Live Tokyo 2025 での、Google 検索リレーションズチームの Gary Illyes(ゲイリー・イリース)氏と Cherry Prommawin(チェリー・プロマウィン)氏のセッションのハイライトをレポートします。
両氏は、Google 検索のライフサイクルにおける AI 役割に関して解説しました。

Search Central Live Tokyo 2025

クロールにおける AI の役割

検索の初期プロセスであるクロールは、「Googlebot」というソフトウェアに依存しており、インターネットの閲覧、ウェブページのダウンロード、リンクの抽出を実行します。

  • 統一されたインフラ: 従来の検索結果のためのクロールと、検索 AI 機能(AI Overview や AI Mode など)のためのクロールに違いはない。これらは完全に同じクローラーを利用している。
  • 発見と効率性: Googlebot は、既知のページから未知のページへのリンクを辿ることでページを発見する。数兆もの URL が存在するため(その多くは発見されることがない)、クローラーはアルゴリズムを使用し、サイトの質やサーバーの負荷容量に基づいてクロールの頻度と量を決定している。
  • LLM との区別: Gemini やその他の LLM は、検索の一部ではない。これらは独自のクロールやデータ収集メカニズムを必要とするが、リソースの制約上、検索と基盤技術(トークン化や重複排除など)を共有している可能性が高いものの、あくまで別個の存在として動作している。

インデックスにおける AI の役割

インデックス処理には、ページの内容を理解し、それを保存すべきかどうかを決定する作業が含まれます。
Google はこのプロセスにおいて、約 20 年から 25 年にわたり AI を活用してきました。

  • モデルの進化: 技術は初期の統計モデルから、BERT のような現代的な Transformer へと進化した。これらのモデルにより、Google は単語を線形に処理するのではなく、文中の「前後」を見て文脈を理解できるようになった。
  • ドキュメントの理解: ページの構造を判断するために AI が使用され、広告ブロック、見出し、画像、メインコンテンツの識別が行われる。このセグメンテーション(区分け)により、インデックス処理の効率が大幅に向上する。
  • 正規化(Canonicalization): AI は、重複コンテンツのクラスタリングや、インデックスにおける代表的な正規ページの選定を支援する。
  • 「AI インデックス」は存在しない: クロールと同様に、検索 AI 機能専用のインデックスは存在しない。AI Overview 向けにコンテンツをインデックスするメカニズムは、標準的な検索のメカニズムと同一である。

サービングにおける AI の役割

サービング(Serving、検索結果の配信)とは、ユーザーがクエリを入力した際に、リアルタイムで検索結果を構築するプロセスです。

  • クエリ処理:
    • 言語検出とクリーニング: システムは言語(英語や日本語など)を検出し、価値を付加しない「ストップワード」(英語の「a」や日本語の「の」「は」の削除など)を取り除く。
    • セグメンテーションと拡張: 日本語のような言語では、AI   が文字列を単語に分割する。また、同義語の拡張(例えば、「写真」と「画像」が意味的に類似していることの理解など)も処理する。
  • ランキングアルゴリズム:
    • リアルタイム性の要件: 毎日見られるクエリの 15% は新しいもの(大谷翔平に関するニュースなど)であるため、ランキングを事前に計算しておくことはできず、リアルタイムで行われる必要がある。
    • MUM(Multitask Unified Model): 2018 年頃に導入されたこのモデルは、例えば「富士山用のハイキングシューズ」と一般的なランニングシューズに必要な地形条件の違いを区別するなど、クエリのニュアンスを解釈するのに役立つ。
    • RankBrain: このシステムは、特定の単語がいつ重要になるかをアルゴリズムが理解するのを助ける。例えば、「Can I beat Mario Kart without cheats(チートなしでマリオカートをクリアできるか)」というクエリにおいて、RankBrain は「without(なし)」という単語を削除してはならないことを学習し、ユーザーが意図とは逆の結果を得ないようにしている。
  • 普遍的なランキングコア: 検索結果の出力が、標準的なリンクであれ、動画であれ、AI Overview であれ、基礎となるランキングエンジンやシグナルは大部分が同じである。「かこって検索(Circle to Search)」や「Google レンズ」は、同じ基本システムによって処理される、単に異なる入力(画像/物体)に過ぎない。

人間によるコンテンツ vs. AI 生成コンテンツ

AI 生成コンテンツに関する業界の懸念についてもイリース氏は触れました。

  • 検知に対するスタンス: Google は、AI 生成コンテンツと人間が書いたコンテンツを区別しようとはしていない。
  • ツールよりも品質: ランキングアルゴリズムは、コンテンツの最終的な品質とユーザーにとっての価値を優先する。コンテンツ作成に使用された特定のツール(人間か LLM か)は、Google のシステムにとって無関係である。

SEO、AIO、GEO の必要性

イリース氏はまた、AIO(AI 最適化)や GEO(生成エンジン最適化)といった新しい業界の略語についても言及しました。

  • 新しい略語の冗長性: 検索 AI 機能は従来の検索と同じクロール、インデックス、配信メカニズムを使用しているため、AIO や GEO を別の施策として扱う必要はない。
  • 結論: 特定のアルゴリズムの分岐に向けてコンテンツを操作しようとするのではなく、ユーザーのために高品質で自然なコンテンツを作成することに注力すべきという基本的なアドバイスは変わらない。検索に対して SEO が適切に行われていれば、それは検索 AI 機能に対しても効果的に最適化されていることになる。

◆◆◆

「AI Overview や AI Mode など AI 検索専用のクローラーもインデックスも存在しない」というゲイリーの言葉は、SEO 担当者にとって非常に重要な確認事項です。
結局のところ、検索の AI 機能も従来のランキングシステムの上で動いているに過ぎません。

僕たちがやるべきことは、アルゴリズムの裏をかくことではなく、これまでどおり Google が理解しやすいサイト構造と、ユーザーが満足するコンテンツを提供し続けることです。