[レベル: 上級]
構造化データが LLM のページ理解を手助けするかどうかという問題は、議論が分かれるところです。
役に立たなかったという検証結果もありますが、そもそも検証方法が適切でなかった可能性も否定できません。
Google の John Mueller(ジョン・ミューラー)氏が個人的な見解としつつも、この疑問にコメントしました。
AI と LLM における構造化データの価値
構造化データが LLM の理解に役立つのかどうかの質問が Reddit に投稿されました。
ミューラー氏は次のように返信します。
この問いは、これから 1 年、そしてそれ以上の期間にわたって私たちにつきまとうだろう。結論を短く言うと、「はい、いいえ、そして場合による」だ(あくまで私個人の視点であり、公式ガイダンスではないし、私以外の誰かを代表して話すこともできない)。
構造化データ(私は構造化フィードもこれに含めている)と非常に相性の良い機能もある。たとえば、ショッピングにおける価格、送料、在庫状況などは、テキストページから高い精度で正確に読み取ることは、基本的に不可能だ。もちろん、詳細は変化していく。だからこそ、変化に適応しやすい仕組みを使うことが重要だ。
また、理論上は、ページのテキストから理解できる機能もあるが、機械にとっては、(英語だったり、ウェールズ語だったり……7,000 以上ある言語のどれかで書かれているかもしれない)ページを解釈しようとするよりも、機械可読なデータを読む方がはるかに簡単だ。
一部のビジュアル要素は、特定の構造化データに依存している。それが欲しいのであれば、指示に従うしかない。これらはコンテンツが提供される場所や携帯、また企業ごとに異なるし、時間とともに確実に変わっていく。様子見をしていると、その「タイプ」は実装した直後に廃止されるかもしれない。だからこそ、サイトにとって意味があるタイミングで簡単に追加できる状態にしておくことが大切だ。
そして、その他の構造化データタイプについては……正直、願望的思考が多い分野だ。昔からそうだったし、これからも変わらない。
「最高の地域別保険比較サイト」だと主張して、保険のマークアップを追加したところで、順位が良くなることはない。
ミューラー氏の見解の要点
ミューラー氏の返答の要点をまとめるとこうなります。
状況によって回答が異なる(Yes, No, It depends)
LLM の理解に構造化データが役立つかどうかという問いに対して、一概に「はい」か「いいえ」で答えることはできず、対象となるデータの種類や機能によって状況が変わるとしています。
高い正確性が求められるデータには不可欠
価格、配送、在庫状況といったショッピング関連の情報は、テキストからだけでは正確(High fidelity)に読み取ることが非常に困難です。
こうした正確性が不可欠な項目については、構造化データ(または構造化フィード)が非常に有効です。
言語の壁を越えた効率的な処理
理論上はテキストから理解可能な内容であっても、世界に 7,000 以上ある言語を解析するより、機械が読み取りやすい形式(構造化データ)で提供する方が、システムにとって処理の負荷が低く、理解を容易にします。
視覚的要素や特定機能への対応
特定の検索結果のデザインや機能(リッチリザルトなど)を表示させるには、指定された構造化データの導入が必要です。
ただし、これらはプラットフォームごとに異なり、時間とともに変化するため、迅速に対応・変更できる体制を整えておくことが重要です。
ランキングへの直接的な影響は「限定的」
「構造化データを追加すれば、特定のキーワードで上位表示される」という考え方は、多くの場合「期待しすぎ(Wishful thinking)」であると指摘しています。
構造化データは内容の理解を助けるものであり、サイトの評価を不当に高める魔法ではないという点に注意が必要です。
まさに、「状況による」です。
役立つ場面もあれば、たいして、あるいはまったく意味がない場面もあります。
ショッピング検索やリッチリザルトなど明確な効果が期待できる場面であれば構造化データの積極的な利用は価値があります。
一方で、手当たり次第にマークアップしても無駄な労力に終わる可能性が高いでしょう。
柔軟に対応できる環境を整えておくことが重要です。
