XMLサイトマップのインデックスをブロックする方法

SERPに出たXMLサイトマップ

更新が頻繁なサイトでは、XMLサイトマップ送信はインデックス促進のためにぜひとも取り入れたい操作です。

しかし、XMLサイトマップは検索結果に表示させる必要はありません。

なぜなら、訪問者にサイト内のコンテンツを案内するHTMLのサイトマップとは違い、XMLサイトマップは検索エンジンのクローラを相手にしたファイルだからです。

表示されたからといって害があるわけではありませんが、ユーザーにとって役に立つとは思えないし、気分的にイヤだという気持ちをいだくサイト管理者もいるのではないでしょうか。

記事の頭に載せたキャプチャは、SERPに表示されたこのブログのXMLサイトマップです。
フツーの検索者はクリックしそうにないですよね。

ということでこの記事では、XMLサイトマップのインデックスを防いで、検索結果に出てこないようにする設定をお伝えします。

WebmasterWorldのスレッドを参照しました。

.htaccessに以下のように記述します。

<filesmatch "^sitemap\.xml$">
Header set X-Robots-Tag: "noindex"
</filesmatch>

X-Robots-Tagとは、meta robotsタグを書き込めないPDFやWordなどのファイルのインデックスを制御する特別な仕組みです。

XMLサイトマップに、meta robotsタグの”noindex”を書くわけにはいかないですよね。

1行目の”filematch”は、XMLサイトマップのファイル名が来るので、”sitmap.xml”以外の名前でXMLサイトマップを作成しているときは、修正してください。

GoogleとYahoo!は、X-Robots-Tagをサポートしています。
Microsoft(Bing)は、分かりません。w

Googleだけが対象だったら、robots.txtのnoindexディレクティブでも、インデックス拒否できるのではないかと思います。

User-Agent: Googlebot
Noindex: /sitemap.xml

Disallowにしてはいけません。
Googlebotが、サイトマップファイルにアクセスできなくなってしまいます。
インデックス(検索結果への表示)だけを禁止します。

XMLサイトマップがインデックスされても特に気にしない、というのであれば役に立たない記事になってしまいましたが(笑)、なんとなく気持ち悪いという人は、ここで伝えた設定でSERPから非表示にしてください。