2011年10月21日
[レベル:上級]
ウェブサイトの品質を評価するためのガイドラインが書かれているGoogleの内部文書が外部に出回りました。
Googleが社内で用いている部外秘のドキュメントになります。
この品質評価ガイドラインは、3年半前にも出回りました。
僕は運よく入手できたでの3回に分けて解説しています。
ガイドラインには、どのようなシステムを使ってサイトを評価するのか、Googleが定めるウェブスパムとはどんなサイトなのかなどが説明されていて、サイト評価者ためのマニュアルとして利用されていると判断できました。
今回、品質評価ガイドラインの更新版と思われるドキュメントをPotPieGirlのJenniferさんが発見し彼女のブログで解説しています。
記事公開直後は彼女が見つけた品質評価ガイドラインも公開していてダウンロードできたのですが、やめるようにとGoogleから連絡が来て現在はダウンロード用のリンクは取り外されています(Googleから連絡が来たということは、本当にGoogleの内部ドキュメントだという証拠になりそうです)。
ですが、Googleに見つかる前に僕はこの情報を知ることができたので、またまた運良くガイドラインの入手に成功しました。
ガイドラインは全部で125ページあるPDFドキュメントです。
表紙はなく、「General Guidelines Version 3.18」という見出しで始まり、日付には「March 30, 2011」と書かれています。

中身は、6つのパートに分かれています。
- Part 1: Rating Guidelines
- Part 2: URL Rating Tasks with Query Locations
- Part 3: Rating Examples
- Part 4: Webspam Guidelines
- Part 5: Using EWOQ
- Part 6: Quick Guide to URL Rating
- Part 7: Quick Guide to Webspam Recognition
パート4では、ウェブスパムのガイドラインについて説明しています。

参考になる情報が詰まっているのは間違いないのですが、Googleの所有物になるのでこのブログで解説していいか思案中です(ページのキャプチャを載せるのも本当は良くないですね)。
品質評価用ガイドラインに何が書かれているか知りたい人は、PotPieGirlの記事に重要点がまとめられているので読んでください。
ダウンロードは中止になっています。
しかし先に手にした誰かががどこかで公開しているかもしれません。
原本が欲しい人はググッて探してみてください。




pdf手に入れることが出来ました。
貴重な情報ありがとうございました。
解説していただけるとありがたいのが本音ですが、迷惑がかかるといけないので、少しずつ自分で努力してみます。
*** Reply from Suzuki Kenichi ***
見つかりましたか。さすがですね。
ページ数が多いので僕もまだぜんぶ読んでません。
機会を見て特に重要そうなのを記事にするかもしれません。
> 原本が欲しい人はググッて探してみてください。
Googleはクローリング時にPDFの中身もチェックしてると思うのですが、
今回流出したPDFにリンクを張っている様なサイトを
Googleの検索結果から意図的に外す様な処理は行わないのですかね。
鈴木さんの「ググッて探して」という言葉に、ふと思いました。
*** Reply from Suzuki Kenichi ***
そんなことはないとは思いますが、どうでしょうね。
コンタクトをとってきて「削除してくれ」はありそうですけどね。