ページネーションにおけるrel=“canonical”タグの正しい使い方 at SMX West 2011

今日のエントリもSMX Westのセッションからのレポートです。

扱うトピックは、GoogleのMaile Ohye(マイリー・オイェ)さんが説明した、「ページネーションにおけるrel=”canonical”タグ(属性)の使い方」です。
※ページネーションとは、ここでは1まとまりのコンテンツを複数のページに分割する、いわゆる「ページ送り」を意味します。

たとえばECサイトで靴を通信販売していたとします。
あるカテゴリで、1ページにつき商品を10個表示していて、全部で200種類の靴があったとします。
この場合ページネーションすると、合計で20ページができあがります。

こんなケースでrel=”canonical”タグを使うとしたら、あなたはどうしますか?

僕だったら、2ページ目以降のページでは1ページ目を指し示すようにrel=”canonical”タグを記述します。
つまり「ページ2」〜「ページ20」を「ページ1」に正規化するわけですね。

どのページも似かよっているし、2ページ目以降のページにリンクが張られたら1ページ目に統合できます。
1ページ目さえ検索結果に出れば2ページ目以降は出なくても問題なしと考えます。
SEO的にはこの方法が最適に思えます。

と・こ・ろ・が、マイリーさんによれば、これは間違った使い方だということです。

重複コンテンツを1つのまとまりにするのがrel=”canonical”のもともとの目的で、ほぼ一致したページかサブセットのページにのみ利用しなければならないそうです。
※「サブセット」というのは、「一部分」という意味です。

先ほど例に出した靴の場合は、各ページのコンテンツは見た目には同じようかもしれませんが、実際には一致していませんね。
したがってrel=”canonical”タグの本来の使用目的にそっていないのです。

ではどうすればいいかというと、全部の靴が掲載されているページを準備しておいて、rel=”canonical”ではその全部の靴が載っているページを正規化するURLとして指定します。

分割された1ページ目から20ページ目は、全部が載っているページの一部分、すなわちサブセットなのでrel=”canonical”タグの用途に完全に合致しています。

もし仮にrel=”canonical”タグによって2ページ目以降を1ページ目に正規化したとしても、Googleは無視するだろうとのことでした。

このサブセットページでのrel=”canonical”タグの使い方は、おなじみGoogleのMatt Cutts(マット・カッツ)氏がウェブマスター向けQ&Aビデオで解説したことと重なっています。

Matt Cutts氏はこのビデオで、1件のレビューごとにページが作成されていて、かつすべてのレビューが載っているページがある場合、個々のレビューのページがrel=”canonical”タグで全レビューが載っているページを指すのは正しい使い方だと説明しています。

まとめます。

ページネーションでrel=”canonical”タグを使う場合は、全コンテンツが載っているページを準備しておき、分割したページをサブセットとしてrel=”canonical”タグで全コンテンツページを正規化の対象に指定するのが、Googleが認める正しい使い方ということになります。

以上。

で話が終わればいいのですが、全コンテンツを一括掲載したページを作れない状況がありますよね。

たとえば、1,000種類の靴が同じカテゴリに存在していたとしましょう。
200種類でもかなり多い気がしますが、1ページに1,000個もの靴が並んでいるのってどう思いますか?
スクロールバーのスライドバーが、いかがわしい情報商材や楽天の販売ページがかわいらしく見えるくらいに極小になってそうですね。(笑)

このようなケースでは次のようにするといいようです。

2ページ目以降に、noindex,follow のrobots metaタグを記述します。

こうすると、2ページ目以降は検索結果に表示されなくなるため重複コンテンツの可能性は確実に排除されます。

しかしfollowのrobots metaタグを明示的に記述しているのでリンク先ページにはPageRankが渡り、2ページ目以降のページに張られたリンクが無駄になりません。
※followはなくても構わないのですが、あったほうがクローラにリンクをたどることを確かに許可できます。

以上。

ですが、少々おまけを。

rel=”canonical”タグが自分を傷つけるくらい強力すぎる件について、マイリーさんとMichael Wyszomierski(マイケル・ウィスゾミエルスキー)氏の2人のGoogle社員に尋ねてきました。

Googleはこの問題を認識しているそうで、間違った使い方だと検出できているときもあるのですが、完全ではないそうです。
トラブルが発生しないように取り組んでいるところだとのことです。

またrel=”canonical”タグをかなり強いシグナルとして適用していることも認めていました。

「ヒント」ではないってことですね。

僕が疑うには、マイリーさんはページネーションにおいてrel=”canonical”タグで2ページ目以降を1ページ目に正規化しても無視するだろうと言っていましたが、きっと無視せずに“僕たちの狙いどおり”に処理するはずです。

でもそんな使い方をしてほしくないから「無視する」と言ったんじゃないでしょうか。

なんといってもコンテンツがまったく異なる内部ページをトップページに正規化してしまうくらい、rel=”canonical”タグは強力ですからね。
ページネーションの正規化なんてこちらの思うがままの気がします。

だからといって、Googleの言うことに従わず隙を突けと言っているわけでもないので勘違いしないでください。

ちなみに、SMXでは(Google社員ではない)あるスピーカーはこんなことを言っていました。

rel=”canonical”は301より評価を渡す

危険なことは自己責任でお願いしますねw