noindexにしたページをサイトマップに記載できるのか? => 処理速度アップが目的で一時的ならOK

[レベル: 中級]

サイトマップには、クロール・インデックスさせたいURLを記載します。
一般的には、インデックスさせるという目的から外れている、次のようなURLをサイトマップに記載すべきではありません。

  • robots.txtでブロックしているURL
  • noindexで検索結果から非表示にしているURL
  • 404エラーを返しているURL
  • リダイレクト元のURL

しかし、クロールを促すサイトマップの特性を利用してインデックスから早急に消したいときには、例外的に、そのURLをサイトマップに記載するという手法を利用することができます。

インデックス非表示にしたいページには「noindex + サイトマップ」がおすすめ

低品質コンテンツは削除するよりも高品質コンテンツになるように改善した方がいいという、GoogleのGary Illyes(ゲイリー・イリーズ)氏とフォロワーたちのTwitterでのやりとりをちょうど1周間前の記事で取り上げました。

一連のやり取りのあと、あるフォロワーが次のように続けて質問しました。

コンテンツが本当にひどくて、もう消したいときは(404よりも)410のほうがいいんですよね?

イリーズ氏は次のように回答します。

どちらでも構わないと思う。どちらかがいいということはない。だけど、「noindexとサイトマップ」を強く推奨する。

低品質ページにはnoindex robots meta タグを記述して、さらにサイトマップに記載して検索結果に出さないようにした方がいいとイリーズ氏はアドバイスしたのです。

noindexページをサイトマップに記述できる?

一見すると何の問題もないかのように思えるかもしれません。

ですが冒頭でも書いたように、サイトマップはインデックス登録(またはインデックス更新)を最終的な目的としてクロールを促進するために使う仕組みです。
検索結果に出さないURLを記述すべきではありません。
John Mueller(ジョン・ミューラー)氏も、ヘルプフォーラムやオフィスアワーなどでそう言っていたことがあると僕は記憶しています。

ところが、イリーズ氏はnoindexページをサイトマップに記述することを勧めています。
「noindex + サイトマップ」の構成は“あり”なのでしょうか?

処理速度アップが目的で一時的ならOK

イリーズ氏のアドバイスが引っかかったのでイリーズ氏本人とミューラー氏に質問してみました。
すると次のような回答をもらえました。

ミューラー氏: ああ、大丈夫だ。noindexページを一時的にサイトマップに載せるのは構わない。だが長期間残しておくのは意味がない。

イリーズ氏: 僕がそうしたURLをサイトマップの載せるように勧めた唯一の理由は、再クロールをスピードを上げるからだ。本当には任意でやることだ。

Yes. Putting noindexed pages there temporarily is fine. Keeping them there for the long run doesn't make sense.

The only reason I recommended putting those URLs in sitemaps is because it will speed up recrawling them. It's really optional.

急いで検索結果から消したくて、そのために再クロールを促すという理由があり、かつ一時的であるならnoindexタグを記述したページをサイトマップに記載しても問題ないというのが結論です。

たいていの場合、noindexページであろうが404ページであろうがサイトマップに記載されれば、通常よりも早くそのURLはクロールされるとのことです。

インデックスから消したいURLをサイトマップに書くというのは、サイトマップのちょっとした“裏ワザ”みたいなものですかね。
Googleのお墨付き(?)なので、使いたい場面が出てきたら使ってみるのもいいでしょう。

ただし、ずっとそのままにしておかないように気を付けましょう。
原則的には、クロール・インデックスさせるURLをサイトマップには記載します。