AIが書いた記事もガイドライン違反の自動生成コンテンツなのか? GoogleはAI生成記事を見分けられるのか?

[レベル: 上級]

検索ランキングを操作することを目的としているなら、自動生成コンテンツは、Google のウェブマスター向けガイドラインに違反する行為です。
AI が書いた記事も例外ではありません。

ガイドラインの自動生成コンテンツに「検索ランキング操作を目的とした」を追加

ウェブマスター向けガイドラインの品質に関するガイドラインには、非推奨の手法の例がリストされています。
「自動生成されたコンテンツ」が先頭に出てきます。

以前は単純な「自動生成されたコンテンツ」でした。
数日前に更新され現在は「検索ランキング操作を目的することを目的とした自動生成されたコンテンツ」に変わっています。
📝すずき注: この記事を書いている時点では日本語ドキュメントは未更新

▼更新前 Automatically generated content intended to manipulate search rankings

▼更新後 Automatically generated content intended to manipulate search rankings

すべての自動生成コンテンツがガイドライン違反ということではなく、検索エンジンを欺くことを狙って作られた自動生成コンテンツがガイドラインに違反することが明確になっています。

もっともリンク先の自動生成コンテンツだけにフォーカスしたドキュメントには一切変更はありません。
したがって、自動生成コンテンツに対する Google 側のスタンスが変わったということではなさそうです。

自動生成コンテンツのドキュメントには、「検索ランキングを操作することを目的としている」と以前から書かれていました。
品質ガイドラインのドキュメントもそちらに合わせただけでしょう。

大げさな印象を与えてしまったかもしれませんが、実質的には影響がない更新です。

AI が書いた記事は自動生成コンテンツになるのか

すべての自動生成コンテンツがガイドライン違反ということではなく、検索ランキングを操作することを目的としてていて、ユーザーの役に立たないコンテンツがガイドライン違反になる(可能性が高い)と言えます。

今、議論になっているのが AI が書いた記事です。
AI を利用して書いた記事はガイドラインに違反する自動生成コンテンツとしてみなされるのでしょうか?

現状では、AI が書いた記事もガイドラインに違反する自動生成コンテンツとしてみなされそうです。

Google の John Mueller(ジョン・ミューラー)氏は次のようにコメントしています。

私たちにとっては、AI が書いた記事は、本質的には自動生成コンテンツの範疇にやはり分類される。人々はいろいろな手段でコンテンツを自動生成しようとするが、AI ツールを使ってコンテンツを作っていたとしても、昔からやられていたような、単語の順番を入れ替えたり同義語に置き換えたり翻訳したりといったようなことをしているなら、本質的には変わらず、ガイドライン違反だ。

昔のツールよりもコンテンツの品質は AI の方が良くなっているかもしれないが、依然として自動生成コンテンツであり、ウェブマスター向けガイドラインに違反する。スパムとみなすだろう。


AI 生成と言えども、あくまでも自動生成コンテンツの範疇に入るとミューラー氏は考えています。

AI が書いた記事であることを Google は見分けられるのか?

AI の技術の進歩はめざましく、人間ですら AI が書いた記事だと見分けられないこともあります。

Google のアルゴリズムは AI が自動生成したコンテンツを識別できるのでしょうか?

ミューラー氏はこう述べています。

識別できると断言はできない。しかし、自動生成らしき痕跡があればウェブスパムチームは間違いなく対策できる。

アルゴリズムレベルでは AI 生成記事を確実に判定するのは難しいようです。
それでもウェブスパムチームの目視によって認識され、最終的には手動対策を与えられると言い切っています。

AI 生成記事は Google にはまだ認められていない

検索ランキングの操作がまったく目的ではなく、AI で記事を書くケースがあるはずです。
たとえば、

  • 記事執筆のスピードアップ
  • 365 日 24 時間体制
  • 人材不足の補強
  • 人件費の削減

検索エンジンを騙す意図がなく人間が書いた記事と同等の品質であれば許容してもらえると期待したいところですが、こうした目的が記事から読み取れるはずもありません。
AI であろうがなんであろうが、自動生成だと判断されたら、そこでアウトなのではないでしょうか。

AI が書いた記事を提供しているなら、ガイドライン違反認定されないように現状では noindex しておくのが無難なように思えます。