使い方はあなた次第、サイトのインデックス状態をチェックできる「インデックス ステータス」がウェブマスターツールに登場

[対象: 上級]

インデックス ステータス」という機能がGoogleウェブマスターツールに加わりました
Googleがクロールまたはインデックス登録できたURLの数についての統計情報を「インデックス ステータス」は表示します。

[健全性] − [インデックス ステータス] で確認できます。
※ドメイン名レベルで登録しているサイトで利用できます。サブディレクトリで登録しているサイトでは利用できません。

「インデックスに登録されたページの総数」は、現在Googleがインデックスに登録してるURLの数です。
それまでの累計になります。
ページを絶えず追加しているサイトなら増えていくのが通常です。

「詳細」タブをクリックすると詳しいさらに詳しいインデックス状態を知ることができます。

各項目を説明します。
さらに詳しいことはヘルプを参照してください。

  • インデックスに登録されたページの総数: 先ほど「基本」タブで見たのと同じ、現在インデックスに登録されているURLの数です。
  • クロール済み: サイト内でGoogleがこれまでにクロールしたURLの累計数です。robots.txtでブロックされたURLやリダイレクトされたURLも含むので、「発見したURL」と置き換えても構いません。クロール(発見)しただけであってインデックスされたとは限りません。noindexタグが記述されたページもここに含まれます。なおその日までの「累計」です。その日だけの数ではないことに注意が必要です(7/27のデータを見ているならその日までの合計であってその日にクロールした数ではない)。
  • ロボットによりブロック済み: robots.txtでブロックされたURLの数です。robots.txtでクロールを拒否したURLがなければゼロになります。
  • 未選択: クロールされたもののインデックスされていないURLの数です。たとえば、重複コンテンツあるいは中身が薄いためにGoogleがインデックスすべきでないと判断したりrel=”canonical”で正規化してあったり、リダイレクトで別のURLに転送されているURLです。

さて「インデックス ステータス」の活用方法ですが、規模の小さなサイトでは利用する場面はさほど多くないと感じます。

キャプチャで見せたのは僕のブログのレポートで、見ても「へぇー、なるほどね」で終わってしまいます。
インデックスがぜんぜん増えていない、突然大きく減ったなどのような問題が発生したことに気付くのに役立つ程度かもしれません。

インデックス数が順調に伸びていればたいていは正常といえるでしょう。

しかし大規模サイトでたくさんのページが日々追加されるようなサイトではそれこそ健全性を知るのに役立ちそうです。

下のキャプチャは、右肩上がりでインデックス総数がきれいに増えているサイトです。

クロール数と未選択も増えています。

クロール数とインデックス数に開きがある場合は、クロールされてもインデックスされていないURLが多いことを示します。
重複コンテンツが発生していることが大きな原因として考えられますが、rel=”canonical”やリダイレクトなどで正規化できているなら問題ないでしょう。

このように開いている理由が分かっていて対処できているなら問題ありません。
なぜ開きがあるのか理由が分からなければ調査し必要ならば対処しなければなりません。

こちらは別の大規模サイトです。

ある時点から「未選択」が増えています(緑色の線)。
インデックスされないページが増えたことを示します。

URLの変更でリダイレクトを行っためです。

「インデックスに登録されたページの総数」がある時点で減っています(青色)。
これは、パンダが日本に来たときに備えるために内容の薄いページを大量に削除したためです。
ですが方針変更して復活させたので、ふたたび増え始めています。
クロール数の伸びにインデックス数が着いて行ってませんが、しばらくの間404を返していたので再登録がゆるやかなペースで行われているためと判断しています(スローペースなことはサイトマップのステータスでも確認済み)。

ほかの利用方法としては、301リダイレクトによるドメイン名の移転のチェックがあります。

正常に処理されていてれば、移転元のサイトの「インデックスに登録されたページの総数」は徐々に減っていくはずです。
同時に「未選択」は増えていくはずです。

移転先のサイトは反対に、「インデックスに登録されたページの総数」が増えていかなければなりません。

何もした覚えがないのに、「インデックスに登録されたページの総数」が突然大きく落ち込んでいたとしたら、robots.txtで誤ってサイト全体をブロックしてしまっているとか何かの拍子にページをたくさん削除してしまったとか、あるいはGoogleにインデックス削除されてしまったとか、何らかの重大な問題が発生していることは間違いないでしょう。

このように、「インデックス ステータス」の利用方法はサイトによって千差万別です。
使い方はあなた次第です。

僕が特に強調したい点は、目に付く変化があってその原因をあなたが把握しているかどうかです。
目立つ変化の原因や複数のグラフの開きの理由が分からなければ知る必要があります。
1つの指標だけを見ずに、複数の指標を比べることも大切です。

ただ残念なのは「インデックス ステータス」だけではどこにどんな問題があるかまでは具体的に把握できないことです。

ウェブマスターツールの別のレポートや他のツール、Googlebotのアクセスログなど他の手段を使わないと診断できません。

そうは言っても、Googleが認識しているデータをより多く入手できるのは嬉しいことです。

Googleウェブマスターツールの他の機能・レポートがそうであるように、「インデックス ステータス」も、ユーザーからのフィードバックを受けて改良されていくことを期待しましょう。