Googleがrel=”canonical”タグを無視する時とGoogleにrel=”canonical”タグを確実に認識させる方法

Googleがrel=”canonical”タグの記述に従わない状況について Matt Cutts(マット・カッツ)氏がパーソナルブログで解説しました。

たとえば次のよう状況が認められた場合は、rel=”canonical”をGoogleは無視することがあります。

  • 存在しない404エラーページを指しているような、たまたま間違って墓穴を掘るような使い方をした場合
  • ハッカーが不正にrel=”canonical”を埋め込んだように見える場合

すべてのページでホームページ(トップページ)を誤って指定してしまいホームページ以外がGoogleのインデックスから消えるrel=”canonical”の誤用は、前に注意を喚起した、このタグに不慣れなサイト管理者が起こしがちなミスですね。

以前よりは間違った使い方の検出力が改善しているかもしれません。
あるサイトで、全ページのrel=”canonical”を意図的にトップページにポイントしましたが、正規化されないページがありました(ブログサイトのカテゴリページが残ったままだった)。

またMatt Cutts氏によると、rel=”canonical”を埋め込むハッキングが最近増えているそうです。
こちらに関しては今週のWeb担当者Forumの連載コーナーでピックアップします。

Matt Cutts氏は、Googleがrel=”canonical”を信用しない別のケースも例示しています。

  • bodyセクションに記述されている場合
  • headセクションにおかしな記述が存在する場合

rel=”canonical”はHTMLコードのheadセクションのなかに記述しなければなりません。
もしこのルールを破ってbodyセクションに記述したとしてもGoogleは無視します。

仮にbodyセクションのなかにあるrel=”canonical”に従ってしまったとしたら、先に例で挙げたハッキングがさらに増えることが予想されるからです。

記事部分だけを編集できるサイトが多く存在します。
無料ブログなどではheadセクションをいじれないものも多いですよね。
記事のなかにrel=”canonical”タグを書けばそのrel=”canonical”タグはHTMLではbodyセクション内に登場します。
従ってしまったとしたらさらにハッキング事件が増えることをGoogleは警戒しているのです。

headセクションに通常あるはずのない記述が見られたときにもrel=”canonical”を無視することがあるそうです。
たとえば普通の文章や普通bodyセクション内でしか使わないタグが存在したら、headセクションを閉じ忘れているんじゃないかとGoogleは想定します。
bodyセクションのrel=”canonical”は信用しないのでこのケースでもrel=”canonical”は無視されるかもしれません。

最後にMatt Cutts氏は、rel=”canonical”を正しく認識させるための重要なヒントを教えてくれました。

headセクションがまったく正常に見える限りは通常は問題ありませんが、安全確実に認識してもらうためにはhead セクションの先頭または先頭に近い位置にrel=”canonical”を記述するといいそうです。

rel=”canonical”タグは使い方を熟知しておくと様々な場面で利用価値が出てきます。

rel=”canonical”タグの理解度について自信がなければこれを機に学んでおきましょう。

SEOビジネス大学オンライン向けに僕が作ったビデオでも、rel=”canonical”の基本を解説しています(要登録)。