rel=”canonical”の正規化で、重複コンテンツを撃退

重複コンテンツ問題の解消に頭を抱えるサイト管理者に朗報です。

Google、Yahoo!、Microosftの大手検索エンジン企業がURLの正規化に対応する共通の取り組みとして、「rel=”canonical”属性」のサポートを開始することを発表しました。

rel=”canonical”は、複製コンテンツページのheadセクションに以下の記述を追加します。

<link rel="canonical" href="http://www.example.com/preferred.html" />

「http://www.example.com/preferred.html」には優先させる(=SERPに表示させたい)ウェブページのURLを指定します。

どのURLを優先するかは、もちろんあなたが決めることです。

たとえば、wwwありの「http://www.suzukikenichi.com/」とwwwなしの「http://suzukikenichi.com/」の2つURLで同じサイトアクセスできる状態で、wwwありをメインにしたければ次のような記述になるでしょう。

<link rel="canonical" href="http://www.suzukikenichi.com/" />

別の例として、ECサイトで、ある商品の個別ページに3つのURLでアクセスできたとします。

  1. http://www.example.com/product.php?item=swedish-fish
  2. http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
  3. http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

1が本来のURLで、2と3が重複コンテンツとなるURLだったとしたら、2と3のページに次の記述を加えます。
※1にも記述して構わない。

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />

301リダイレクトと違って転送されるわけではありませんが、サーチエンジンはrel=”canonical”で指定されたページへの301リダイレクトのように扱います

注意点を列挙します。

  • 同一ドメイン内でのみ機能します。別ドメインのURLは、指定しても処理されません。
  • サーチエンジンはrel=”canonical”ヒントにするだけであって、必ず従うわけではありません。
  • 多少ならばコンテンツが異なっていても、適用されます。
  • HTTPでもHTTPSでも機能します。
  • 相対URLと絶対URLのどちらでも大丈夫ですが、絶対URLが推奨です。
  • 必要なページだけに記述するようにします。
  • 適用状況は次のとおりです
    ・Google:完了
    ・Yahoo!:導入中
    ・Microsoft:導入中
    ※ 2/13現在

301リダイレクトを使った中古ドメインの隠蔽転送のように、rel=”canonical”も乱用・悪用が懸念されます。

GoogleのMatt Cutts氏は、これまで実行してきた他の乱用・悪用に対する防御策をrel=”canonical”に対しても取り入れるし、サーチエンジンをだましたり、ガイドラインに違反するような行為にはそれ相応のアクションを起こすこともあるとコメントしています。

他のサーチエンジンも同様の考えでしょう。
よこしまな考えは抱かないほうが身のためでしょうね。

100%確実でないにせよ、HTMLにタグを追加するだけで重複コンテンツ問題を回避できるのですから、正しく利用したいものです。

P.S.
数々の優れたWordPressのプラグインの提供で有名な、Joost de ValkがWPでrel=”canonical”を利用するためのプラグインをさっそく作成して配布しています。
WPで重複コンテンツ問題を抱えているなら、利用してみてください。
Canonical URL links