Googleのゲイリーが明かすAI検索、Google-Extendedクローラー、404ページの真相 #scldd2025

[レベル: 中級]

タイのバンコクで 7/23 〜 7/25 に開催された Search Central Live Deep Dive Asia Pacific 2025参加した際に、Google 検索リレーションズチームの Gary Illyes(ゲイリー・イリース)氏にインタビューしてきました。

ゲイリーとディスカッションしたトピック

ゲイリーのインタビューでディスカッションしたトピックは次のとおりです。

Google-Extended と AI モデル

  • Google-Extended からのコンテンツであっても、Gemini のトレーニングに使用されるコンテンツと、AI Overview やAI Mode で使用されるコンテンツの違いについて
  • Gemini、AI Overview、AI Mode がグラウンディングのために別々のインデックスを使用しているかどうか
  • AI Overview とAI Mode で使用されるトレーニングデータが、通常の GooglebotGoogle-Extended のどちらによって収集されているか
  • AI Mode と Gemini がウェブ上のライブコンテンツを取得する方法の違いについて

AI 生成コンテンツとモデルのトレーニング

  • LLM が AI 生成コンテンツから学習することの潜在的な欠点。たとえば、検索インデックスの品質への影響や「トレーニングループ」のリスクなど
  • モデルのトレーニングにおいて、特に人間によるレビューを通じて、コンテンツの品質と正確性を維持することの重要性
  • AI 生成コンテンツに対する人間のキュレーションに関する Google のガイドライン

Cloudflare の HTTP 402 Payment Required ステータスコード

  • この新しい技術が、パブリッシャーやGoogleを含むAI企業に利益をもたらすかどうかについての議論

パブリッシャーによる Google-Extended のブロック

  • パブリッシャーによる Google-Extended をブロックが、Google のトレーニングに与える影響
  • AI クローラーに関するパブリッシャー間の考え方の違い
  • 特に Z 世代のような新しい年齢層に対して、AI システムがコンテンツを浮上させ、収益を生み出す可能性

パブリッシャーによる Google-Extended のブロック

  • パブリッシャーがコンテンツの使用を詳細に制御できるようにするための標準(IETF ワーキンググループにおける AI Preferences)の開発
  • AI に関する誤解とイノベーションへの懸念

404 ページとクロールバジェット

  • 404 ページがクロールバジェットを消費するかどうか、そしてなぜ一般的に消費しないのかについての明確化
  • 大量の 404 ページがスケジューリングとサーバーリソースに与える影響
  • サーバーリソースを消費しないように 404 ページを最適化するための推奨事項

AI 生成画像と SEO

  • AI 生成画像が SEO に影響を与えるか、またはペナルティにつながるか
  • 画像検索からのトラフィックなど、AI 生成画像の潜在的な利点

ソーシャルメディアシグナルと SEO ランキング

  • ソーシャルメディアでの閲覧数やシェア数が SEO のランキングシグナルとして使用されるか
  • ソーシャルメディアシグナルがランキングに使用されない、またおそらく今後も使用されない理由

AI Mode における広告

  • AI Mode で広告が表示される可能性
  • AI Mode が主要な検索ツールになった場合の Google の収益への影響

AI に関するゲイリーの個人的見解

  • ゲイリーの、生成 AI よりも予測 AI を好むという個人的な意見
  • 予測 AI の価値ある使用例(サイト品質の向上、要約など)
  • 生成 AI、特に画像生成とハルシネーションに関する懸念

ゲイリーがどんな回答をしたかは動画で確認してください!