AI自動翻訳コンテンツでも価値を提供できていればスパムではない、robots.txtでブロックする必要なし

[レベル: 中級]

多言語サイトの構成を解説するドキュメントから、robots.txt を使用してすべての自動翻訳ページをブロックする方法についてのセクションを Google は、削除しました。

ランキング操作が目的でなければ AI 翻訳は許可される?

以前は、ドキュメントは次の段落を含んでいました。

robots.txt を使用して、自動翻訳したサイトページが検索エンジンからクロールされないようにしてください。自動翻訳は意味が通じない場合があるため、スパムとみなされる可能性があります。さらに重要なこととして、読みにくく不自然な翻訳はサイトのイメージ低下につながるおそれがあります。

現在はこの段落は削除されています。

削除理由は、 2024 年 3 月のスパムアップデートの内容に合わせるためとのことです。
ドキュメントのみの変更であり、ランキングシステムの変更ではないとも述べています。

自動翻訳そのものは問題ではありません。
自動翻訳を利用して質の低いコンテンツを大量生産する行為が「大量生成されたコンテンツの不正使用」のスパムポリシー違反に該当します。

生成 AI が格段に進化し、AI が相当に自然に翻訳できるようになりました。
要は、品質を保った自動翻訳であれば、robots.txt でブロックする必要はないということです(それでも大量生成すれば、問題視されるでしょうが)。

Reddit が自動翻訳ページで検索トラフィックを伸ばす

世界最大のディスカッションフォーラムである Reddit はしばらく前から AI が自動翻訳したページを公開して、検索トラフィックを伸ばしています。

こうした状況について Google は Search Engine Roundtable に次のようにコメントしたとのことです。

特定のサイトやページの状況についてコメントしたり、サイトごとに個別のサポートを提供したりすることはありませんが、当社のポリシーでは、AI によって翻訳されたコンテンツを厳密にスパムと定義しているわけではありません。当社の大規模なコンテンツの不正利用に関するポリシーでは、ユーザーにほとんど、あるいはまったく価値を提供しない非独創的なコンテンツを大量に作成することに対する全体的な警告の一環として、翻訳を含む自動変換について言及しています。

ここでも、AI 翻訳自体がスパムではないと明言しています。
自動翻訳かどうかではなく、価値を提供しないコンテンツを大量作成が問題視されます。

裏を返せば、価値を提供できていれば自動翻訳は許可されるということです。