グーグル、Diversityアルゴリズム&CLIRサービス

GoogleのSearch QualityチームのVice President、Udi Manber(ウディ・マンバー?)氏へのインタビューが、Popular Mechanicsで公開されました。

注目すべき点を、ピックアップします。

Googleは昨年2007年に実に450以上にものぼるアルゴリズムの改良を行いました。
単純計算で、1日1つはアルゴリズムに変化があるということですね。
(もちろん、まとめて実行しているでしょうが)

Googleは検索結果を、人の手で変更することはしません。
4位に位置するサイトが1位だと判断しても、決して手動で変更することはなく、アルゴリズムに反映されるようにします。

この2点に関しては、SEMリサーチさんが「スパムサイトは手動で削除されることがある」という補足と共に解説しています。

Googleは、アルゴリズムの改良のために日々実験を繰り返していて、このインタビューの前の週にもリアルタイムで、新しいアルゴリズムの試験を実施しました。

ごく限られたユーザーに対してだけ、新しいアルゴリズムを採用し、通常の検索結果と比較します。

この実験では、「Diversity」要素を組み込んだアルゴリズムを調査しました。
「Diversity」というのは、日本語に直訳すると「多様性」という意味になります。

「Diversity」が具体的にどういったことを指すのかは言及していませんが、検索キーワードに直接現れていない隠れているユーザーの意図を、察知することだと推測されます。

新アルゴリズムが成功した事例として、「New York Times address」という検索を引き合いに出しています。

普通に考えたら、「ニューヨークタイムズの住所」を調べる検索と判断しますが、多くのユーザーが調べたのは、実験の前の日に「ニューヨークタイムズで報じられた何かの住所」を調べる検索だったようです。

Diversityを考慮に入れた新しいアルゴリズムと、Fresshnessを考慮に入れたアルゴリズムは、うまく機能しました。

多種多様なユーザーの検索から、真の要求を汲み取るDiversityアルゴリズムが実装されれば、タイトルタグやHタグがどうとか、バックリンクがどうとか、ましてやキーワード出現率なんてものは、用を成さなくなりそうですね。

またGoogleは、より適切な検索結果を提供するために他のユーザーの検索データも利用しています。
ツールとしても提供していて、検索結果ページの上下に「関連検索」として、検索キーワードと関係性の高いキーワードの組み合わせが表示されます。
これは、ご存知ですよね。

最後は、新しいGoogleのサービスです。


その名は、「CLIR(Cross Language Information Retrieval)」と言います。

用語をうまく日本語に訳すのは難しいのですが、「言語の違いを飛び越えて情報を取得する」仕組みです。

検索結果を別の言語に訳してしまいます。
つまり、もしあなたが英語が分からなくても、英語のサイトを訳して情報を提供してくれるのです。
今のところ、12カ国の言語で準備が進められています。
Google Translateの機能を利用するとのこと。

ブログヤフーグーグルSEO対策ドットコムさんの言う、「ユニバーサルキーワード」の時代が、本当に訪れそうです。

現状では、ほとんどの機械翻訳サービス・ソフトの質は高いとは言えません。
ですが、きれいな(文法的に整っている)文章なら、かなり的確に訳してくれるようです。

ブログヤフーグーグルSEO対策ドットコムさんによれば、たとえばNASAのサイトは、ほぼ完璧な日本語に訳されるそうです。

実際私は無料翻訳機を毎日使うのでわかるのだが、無料翻訳機の性能は日々進化している。特にNASAのようなサイトは綺麗な文章だからなのか、NASAのサイト運営者が翻訳しやすい文章にしているせいか、非常にユーザーにやさしいサイト作りをしている。そのためNASAのホームページは翻訳ソフトによってはほぼ完璧な日本語変換で見れるのである。

日本人ユーザーだけではなく外国人ユーザーの検索も視野に入れるのなら、「美しい日本語」でコンテンツを作成しておいたほうが良さそうですね。

となると親しみやすい口語調よりも、模範的な言葉を使う文語調の方が、検索エンジンには優しいのでしょうか?
堅苦しい文章は、検索エンジンには好かれそうですが、読者離れを引き起こしそうですね。(笑)

インタビューを読み終わった感想として、「今せせこましくやってるSEOは、あっという間に無意味になってしまいそう」、そんな気がしました。