2010年04月21日
検索エンジンがインデックスするのをブロックするには、robots.txtやmeta noindexタグを使います。
では、コンテンツの一部分だけをインデックスされないように指示することは可能でしょうか?
「コメントを書く」や「印刷する」といった言葉が頻繁に出てくるとそれらのキーワード密度が高くなりすぎるのでインデックスさせないようにする方法はあるか?
こんな質問にGoogleのMatt Cutts氏が回答しました。
結論だけいうと不可能です。
そもそもキーワード密度など気にする必要はないとのことです。
キーワードの出現回数が問題になるのはよっぽどくり返し大量に使っている場合になります。
普通はキーワード密度なんて心配することはないそうです。
自分でターゲットにしているキーワードがユーザーが読むのに不自然なくらい連発されているならそれは自分で減らせばいいだけの話ですね。
そもそも今どきの検索エンジンはキーワードの出現回数や出現頻度なんて見てないでしょう。
キーワードを使いすぎてペナルティを食らうというのはありそうですが、キーワード出現頻度が何%だからプラスに作用するというのはまずないはずです。
「コメントを書く」や「印刷する」といったフレーズがウザくなるほど繰り返されているサイトって想像しづらいし、もしあるとしたら一部分のインデックスを防ぐよりもページの構成そのものを見直した方がよさそうですよね。
一方Yahoo!はページ内の一部のコンテンツをメインのトピックとは関係ないと伝えることが可能です。
上で紹介したビデオでMatt Cutts氏が少し触れています。
この前解説した「Googleはスニペットに表示させたくない記述も指示できない」のビデオでも触れていました。
どんな方法だったのか思い出せなかったのですが、自分のブログに書いてました。(笑)
class=”robots-nocontent”という属性を利用します。
Yahoo!インフォセンターにも記載されています。
ウェブページには、ヘッダやフッタ、ナビゲーションメニュー、著作権表記、広告など、ウェブページの内容との関連性が常に高いとは限らない部分があります。このような部分は、HTMLタグ(<div><span>など)にclass="robots-nocontent"属性を指定することで、ウェブページの主な内容とは関連性の低い内容であることを、YSTに通知できます。
Matt Cutts氏によれば、class=”robots-nocontent”を実際に使っているサイトはほとんど存在しないとのことです(使ってないというより存在を知らないですよね?)。
Googleはサポートする予定もなさそうです。
まとめます。
Googleではコンテンツの一部分だけのインデックスをブロックすることはできません。
もしブロックしたい理由が特定の語句の出現頻度にあるなら、尋常ではないくらい繰り返されているのでなければ心配することはありません。
Yahoo!ではコンテンツの一部分の重要性が低いことを通知できますが、Googleはサポートしていません。
【P.S.】
Yahoo!のclass=”robots-nocontent”属性を使ってる人っていますか?
きちんと機能してるんですかね。
これを使ったらフッターのコピーライトとかどうでもいいような記述がSERPのスニペットに採用されるのを防げますかね。




>robots-nocontent属性を使ってる人っていますか?
使ってます。
>きちんと機能してるんですかね。
わかりません。Yahoo!がrobots-nocontentの事を忘れていないことを祈ります。
>SERPのスニペットに採用されるのを防げますかね。
余裕で採用されてます。
*** Reply from Suzuki Kenichi ***
レポートありがとうございます。
って、ぜんぜんダメじゃないですか。
使えない機能っぽい気がしてきました。
4ヶ月にわたり導入したり削除したりを複数サイトでテストしました。
>SERPのスニペットに採用されるのを防げますかね。
こまったスニペットになっていたためテスト導入したのですが一応これで画面は100%改善しました。
しかし実際にクロールされてインデックスの交換が行われて結果に反映されるまでページにより早くて1週間~長くて2ヶ月かかっています。
表示テキストの操作はこれによりできましたが
これにより検索順位の上昇下落に影響を与えるかどうかは定かではないです。
また不安点としてリンク部分だったら内部リンクの扱いがどうなるのかというのがあります。
*** Reply from Suzuki Kenichi ***
Aさんの場合はきちんと機能しているようですね。
時間がかかるときもあるようですが、無意味ということではなさそうですね。
内部リンクについても重要度が下がりそうな気はしますが、確かめるのは難しそうです。
情報提供ありがとうございました。
>もしあるとしたら一部分のインデックスを防ぐよりもページの構成そのものを見直した方がよさそうですよね。
はじめまして。鈴木さんの情報はいつも楽しみにしています。
これ、もしできるならいいなあって感じで思ってました。
ウェブマスターツールで自分のECサイトのキーワードを見ると、「商品」がキーワードの重要度100%に
なっていて、それに続いて自分でターゲットにしているキーワードなどが続いている状態なんです。
「商品」がなぜ突出して数えられてしまうのかというと、ちょっとしたコンテンツよりも
商品の紹介ページの方が圧倒的な数になる構造のECサイトで、それぞれの商品の詳細ページには
「商品番号」ってのがあるからなんです。(たぶん)
でも、同じ条件で詳細ページに表示されているはずの「販売価格」やその他の言葉などは「商品」という言葉と
同じようにカウントされていないどころか、ないに等しい%です。
なので、サイトの構造がこのECサイトと同じような場合に、もしかしたら「コメントを書く」や「印刷する」と
いった言葉がくり返し大量に出現して、結果キーワードの重要度100%になってしまい、望まないキーワードを
たくさんインデックスさせたくないから勘弁して!というケースは実際にあるのかもしれません。
*** Reply from Suzuki Kenichi ***
WMTのキーワードは単に出現回数で判断しているので重要視しているということではありまえせん。
どのキーワードが重要かはキーワードの数じゃなくて別の要素(titleタグやアンカーテキスト、関連用語の出現など)できちんと判断できているはずなので、気にすることはないです。
部分的にインデックスを拒否できたら便利だと思います。
ブログのサイドバーにある『最新の記事』や『人気の記事』がSERPに登録されていて、
検索エンジン経由でサイトに人は記事が見つけられず直帰されてしまった経験があったので。
*** Reply from Suzuki Kenichi ***
スニペットに出てしまうということですか? 検索キーワードに関連性が高いと認識されてしまっているようですね。
サイトリンクのことなら、ある程度なら対処のしようがありますが。
スニペットでした。わかりにくい表現で申し訳ありません。
Yahooでのみ起こっている現象なので”robots-nocontent”は試してみようと思います。
*** Reply from Suzuki Kenichi ***
Yahoo!のスニペットはコントロールしづらいですよね。
結果が出たら教えてください。