rel=canonicalで正規化した重複URLが検索結果にインデックスされる理由

[対象: 初級]

rel=”canonical”で正規化しているにもかからわず、重複URLが検索結果にインデックスされることがあります。

どうしてなのでしょうか？

rel=”canonical”は第2段階、第3段階の処理

11月21日と12月5日のオフィスアワーハングアウトで、GoogleのJohn Mueller（ジョン・ミューラー）氏が説明しています。

簡潔にまとめると、GooglebotがクロールしたそのURLをまず最初にインデックスしその後にrel=”canonical”が処理されることが理由です。
rel=”canonical”の処理はすぐさま実行されるわけではなく、第2段階、第3段階のステップになります。

したがって正規化前のURLが一時的に検索結果に表示される状況は普通に起こりうることです。
rel=”canonical”を認識し処理が完了すれば、rel=”canonical”が示す正規化後のURLがやがて検索結果に表示されます。

同じ理由から、ウェブマスターツールの「HTMLの改善」でも重複としてレポートが出るかもしれません。
間違いなく正規化できているなら気にしなくても大丈夫です。

ただし、rel=”canonical”を検索エンジンは「命令」ではなく「ヒント」として扱います。
必ずしもrel=”canonical”で示したURLを優先するとは限りません。

すべてのページのrel=”canonical”がトップページに向けられていたりどこからもリンクされていないURLをrel=”canonical”で指定していたりしたら、無視するかもしれません。

とはいえ、rel=”canonical”はかなり強いシグナルです。
誤った使い方をすると予期せぬ結果を引き起こすことがあるので注意が必要です。

一時的といえど、重複URLをインデックスさせたくないのであれば301リダイレクトを使います。

301リダイレクトは、優先するURLに重複URLを強制的に転送します。
なので重複URLを検索エンジンはクロール、インデックスしません。

この記事で説明したことは、rel=”canonical”の基本的な動作です。
SEO上級者の人は知っていて当然のことだと思います。
もし初めて知ったとしたら、rel=”canonical”で正規化したはずの重複URLが結果結果にインデックスされていても異常ではないので安心してください。