[レベル: 初級]
生成 AI で作成したコンテンツをサイトで公開する際の、Google 検索におけるガイダンスを Google は検索セントラルサイトに公開しました。
新規公開されたばかりのドキュメントですが、すでに日本語訳ページができています。
したがって、全体はご自身で目をとおしてもらうとして、この記事では概要を紹介します。
AI 生成コンテンツに関する Google のスタンス
特にトピックの調査やオリジナルコンテンツの構造化において生成 AI が有用なツールとなり得ることを Google は認識しています。
基本的な原則は、AI によって生成されたかどうかにかかわらず、コンテンツはユーザーのために作成され、価値を提供することです。
検索ポリシーの遵守
生成AIによって作成されたものを含むすべてのコンテンツは、Google の検索の基本事項およびスパムに関するポリシーに準拠する必要があります。
特に注意しなければならないのは「大量生成されたコンテンツの不正使用」です。
これは AI やその他のツールを使用して、ユーザーに独自の価値を提供しない多数のページを生成する行為です。
こうした行為は Google のスパムポリシーに違反する可能性があります。
また、検索品質評価ガイドラインの次の 2 つの関連セクションにもドキュメントは言及しています。
- セクション 4.6.5: Scaled Content Abuse
- セクション 4.6.6: MC Created with Little to No Effort, Little to No Originality, and Little to No Added Value for Website Visitors
検索品質評価ガイドラインは日本語訳が存在しないので、この 2 セクションだけは訳します。
4.6.5 大量生成されたコンテンツの不正使用
編集や手動のキュレーションを行わず、わずかな労力や独自性で大量のコンテンツを作成することは、スパム性の高いウェブサイトの特徴です。
大量生成されたコンテンツの不正使用は、Google 検索のウェブスパムポリシーで説明されているスパム行為です。これは、多くのページがユーザーを助けるのではなく主にサイト所有者の利益のために生成される場合に発生します。この行為は、多量の独自性に欠けるコンテンツを作成し、ウェブ上の同種の他ページと比較して訪問者にほとんど価値を提供しないことを目的とするのが一般的です。生成方法がどうであれ同じです。
大量生成されたコンテンツの不正使用の例:
- 自動化ツール(生成 AI を含む)を利用して、同一トピックのウェブ上の他ページと比べて訪問者への価値がほとんどないページを大量に低コストで生成する
- フィード、検索結果、その他のコンテンツをスクレイピングし、同義語置換や翻訳、その他の難読化技術など自動変換を含めて多くのページを生成し、訪問者にほとんど価値を提供しない
- 異なるウェブページのコンテンツをつなぎ合わせたり組み合わせたりしても、付加価値を加えていない
- コンテンツを大量生成していることを隠す目的で複数のサイトを作成する
- 読者にとって意味を成さないが検索キーワードを含むページを大量に作成する
独自性やユーザーへの付加価値のないコンテンツを大量生成したページやサイトは、どのように作成されたかにかかわらず、「最低」に評価されるべきです。たとえ生成 AI ツールで作成されたかどうか判断できなくても、サイト内の複数のページを確認して拡大量産コンテンツの悪用が強く疑われる場合は、「最低」評価を適用してください。
4.6.6 労力がほとんど/まったくかかっていない MC、独自性がほとんど/まったくない MC、訪問者への付加価値がほとんど/まったくない MC
※すずき補足;「MC」は Main Content(主要なコンテンツ)の略ページ上の MC(テキスト、画像、音声、動画などを含む)のすべてまたはほとんどが、コピー、言い換え、埋め込み、自動生成または AI 生成、もしくは他ソースからの転載であり、労力や独自性、訪問者への付加価値がほとんど/まったくない場合、そのページは 「最低」 価となります。ページがコンテンツの出典として他ソースにクレジットを付与していても、同様に「最低」に評価してください。
参考までに、コンテンツ作成には、ページ上でコンテンツを直接作成することから、カスタムページ機能を構築することまで、さまざまな形態の労力があります。「労力がほとんど/まったくかかっていない」とは、いかなる種類の労力もほとんど/まったく費やされていないことを意味します。Main Content の品質 3.2 節の「Effort」の説明を確認してください。
「コピー」とは、スクレイピングによるコンテンツの収集、または非提携サイトからコンテンツをコピーし、ユーザーに独自のコンテンツや価値を追加せずに使用することを指します(コピー/スクレイピング コンテンツの詳細は「こちら」を参照)。コピーされ得るコンテンツの種類は、テキスト、画像、動画などあらゆる形式を含みます。画像は検出を避けるためにわずかにトリミングや編集が行われる場合があります。動画も同様に加工されたり、画面に再生している動画を撮影したものが作成されることもあります。
コンテンツの品質と正確性の優先
生成AIを使用する際には、正確性、品質、関連性に重点を置くことが不可欠です。
これには、検索結果に表示される可能性のある次のようなメタデータを含む、コンテンツのすべての部分に適用されます。
<title >
要素- meta description
- 構造化データ
- 画像の代替テキスト
構造化データ関しては、一般的なガイドライン、個々の検索機能の特定のポリシーに従い、検索機能の対象となるようにマークアップを検証することも重要です。
ユーザーへの透明性の確保
コンテンツがどのように作成されたかに関する情報を共有することが、読者にとって貴重なコンテキストを提供できると Google は提案しています。
コンテンツが自動生成されている場合は、自動化の使用について読者に知らせることを検討します。
たとえば、そのコンテンツがどのように採用されたかに関する背景情報を公開します。
EC に関する特定のガイドライン
EC サイトについては、Google Merchant Center が AI 生成コンテンツに関するポリシーを定義しています。
AI 生成画像には、IPTC DigitalSourceType
TrainedAlgorithmicMedia
メタデータを含める必要があります。
一方で、AI 生成商品データについては、個別に指定し、AI 生成コンテンツであることを明確にラベル付けする必要があります。
生成 AI によるコンテンツを使用するための Google 検索のガイダンスは、Google 検索 の AI 検索最適化のベストプラクティスと同時に公開されました。
AI 検索最適化のベストプラクティスと同様に、特に目新しい情報はありません。
それでも、生成 AI を利用してコンテンツを作成する機会が増えてきたサイトも多いはずです(この記事も、翻訳に Gemini を使っています)。
スパムポリシーに違反しないことを確実にするために、ガイダンスを一読しておくことを推奨します。