rel=“canonical”タグ

JS挿入してクライアントサイドでレンダリングしたcanonicalタグをGoogleは実際にはきちんと処理することが判明

JavaScript によってクライアントサイドでレンダリングした rel=canonical タグを Googlebot は無視することが Google I/O 2018 で明らかになった。しかしながら、JavaScript によって挿入された rel=canonical をきちんと処理するケースが実際にはあるようだ。検証の結果、判明した。

レンダリング後にGoogleに無視されるのはrel=canonicalとrel=amphtmlの2つだけ。hreflangとprev/nextはクライアントサイドでの挿入が可能

JavaScript で DOM を操作してクライアントサイドでレンダリングした rel=canonical は Google には無視される。rel=amphtml も同様に無視される、これら2つのタグは生 HTML での配信が要求される。一方で、hreflang と rel=prev/next はクライアント側のレンダリングによる挿入が可能だ。

クライアントサイドでレンダリングしたrel=”canonical”をGoogleは完全無視 #io18 #io18jp

Google は生 の HTML に記述されている rel="canonical" だけを処理する。クライント側のレンダリングで生成された rel="canonical" は完全に無視される。

重複コンテンツ対策にはrel=canonicalを推奨、noindexタグではシグナルがすべて失われる

重複コンテンツの解消には、noindex タグや robots.txt ではなく、rel=”canonical” の使用が推奨される。noindex/robots.txt では重複したページのシグナルがすべて失われてしまうのに対して、rel=”canonical では統合されるからだ。

自己参照のrel=canonicalタグはnoindexタグと併用できる?できない?

rel="canonical" タグは noindex タグが設定された URL に向けるべきではない。しかし自己参照の canonical タグであれば noindex タグを設置していても問題ない。noindex がきちんと処理され、検索結果から非表示になる。

HTTPSでインデックスされるべきURLの80%以上がHTTPのまま、原因は不適切な正規化

Googleのゲイリー・イリーズによると、HTTPSでインデックスされるはずのURLうち、80%以上がHTTPでインデックスされているとのこと。HTTPSへの正規化ミスが原因。また、壊れた証明書を使っているページには検索結果で警告を表示する実験を行っているそうだ。

HTTPSへの移行時にはrel=”canonical”が指すURLもHTTPSに必ず更新すること

サイトをHTTPSへ移行した際には、rel=”canonical”で指し示すURLも忘れずに https:// に更新すること。http:// のままだと移行前のHTTPのURLがインデックスに残ってしまうことがある。

rel=canonicalで正規化した重複URLが検索結果にインデックスされる理由

rel=canonicalで正規化しているにもかからわず、重複URLが検索結果にインデックスされることがある。これは、GooglebotがクロールしたそのURLをまず最初にインデックスしその後にrel=”canonical”が処理されることが理由。rel=canonicalの処理はすぐさま実行されるわけではなく第2段階、第3段階のステップ。

rel=canonicalタグによくある5つの間違い

rel=“canonical”タグの正しい使い方とよくある間違いについて英語版のGoogle Webmaster Centaral ブログが説明した。

ECサイトにおける色違いやサイズ違いの商品ページのベストプラクティス

色違いやサイズ違いの商品をどのように見せるかはECサイトにおいて悩ましい問題だ。ユーザーエクスペリエンスとSEOの両方を完璧に満たす方法はない。しかしそれぞれの状況に応じた、より適切な構成を見出すためのヒントをこの記事では説明する。