配信コンテンツの重複コンテンツ防止に rel=canonical が非推奨になる

[レベル: 上級]

ほかのサイトに記事を配信するシンジケーション コンテンツで発生する重複コンテンツを防止する方法として rel="canonical" タグの使用が非推奨になりました。

配信コンテンツの重複防止はインデックスのブロックを推奨

正規化のトラブルシューティングを解説する技術ドキュメント同時配信コンテンツ (Syndicated content) のセクションが更新されました。

次のように書かれています。

The canonical link element is not recommended for those who wish to avoid duplication by syndication partners, because the pages are often very different. The most effective solution is for partners to block indexing of your content. For more, see Avoid article duplication in Google News, which also has advice about blocking syndicated content from Google Search.

canonical link 要素は、シンジケーション パートナーによる重複を避けたい場合にはお勧めできません。なぜなら、ページが大きく異なることがよくあるからです。最も効果的な解決策は、あなたのコンテンツのインデックスをパートナーがブロックすることです。詳しくは、「Google ニュースでの記事の重複を避ける」を参照してください。これには、Google 検索からシンジケートされたコンテンツをブロックする方法についてもアドバイスがあります。

📝すずき注: 訳は僕による

rel="canonical" の使用を進めていません。
代わりに、配信先サイトの記事をインデックスしないようにすることを勧めています。

リンク先の Google ニュースのパブリッシャーセンターのヘルプ記事では、具体的には、noindex robots meta タグの利用を指示しています。
配信先ページに noindex を設定します。

次の 2 パターンで記述できます。

  • <meta name="Googlebot-News" content="noindex">
  • <meta name="Googlebot" content="noindex">
📝すずき補足: robots meta タグではなく X-Robots-Tag HTTP ヘッダーで noindex を出力してもいい。

Google ニュースだけでの重複を防止する場合は、ユーザーエージェント (name の値) に Googlebot-News を指定します。
すべての Google 検索での重複を防止するなら、Googlebot を指定します。

なお、この記事を書いている時点では、日本語のヘルプページは更新されておらず、rel="canonical" の利用は推奨のままです。

rel=canonical タグを使用する

また、技術ドキュメントの日本語ページも準備されていません。

同一サイト内であれば rel=”canonical” の利用可

説明したように、ほかのサイトへの記事配信の重複を防ぐ手段としての rel="canonical" は非推奨になりました。

しかし、同一サイト内の複数のページ (複数の URL) で同じ記事を掲載する際の正規化の手段としての rel="canonical" の使用はまったく問題ありません。
rel="canonical" が非推奨なのは、あくまでも別サイトへのシンジケーションの場合です。

これまで、推奨だった rel="canonical" が突如として非推奨に変更になった理由は不明です。
rel="canonical" は命令ではなくヒントとして Google は利用するので、効果がないケースがあったのでしょうか?

いずれにしても、記事配信しているサイトで重複コンテンツを確実に防ぐのであれば、方法は noindex 一択になりました。