まだまだある、2012年3月にGoogleが実行した検索品質改善×50+(後編)

[対象: 全員]

Googleがその月に実行した検索品質のための改良や変更をまとめて紹介する「サーチクオリティ ハイライト」3月版の解説の後編になります(前編はこちらからどうぞ)。

25. Googleニュースのローカル結果改善

[ローンチ・コードネーム: barefoot / プロジェクト・コードネーム: news search]
住んでいる国に、より関連したニュース結果が出るようになった。

26. ニュース結果のクラスタなかでランキングを決める指標の廃止

[ローンチ・コードネーム: decaffeination / プロジェクト・コードネーム: news search]
Googleニュースにおいて関連性をもはや高めなくなった指標の1つを廃止した。

27. “兄弟関係”にある同義語の削減

[ローンチ・コードネーム: Gemini / プロジェクト・コードネーム: Synonyms]
オートコンプリートはコンテキストを見て同義語を判断することがある。たとえば「cat」(ネコ)は「pet」(ペット)や「furry」(フワフワした)という言葉のそばによく出てくる。「kitten」(子猫)も同様。そこでアルゴリズムでは、「cat」と「kitten」が同じような意味を持つと推測する。ところがこの方法だと同カテゴリ内の違った存在に対しても同義を割り当ててしまう。「dog」(犬)も「furry pet」になりえるので、結果として「dog」と「cat」が同義語として認識されてしまうかもしれない。こうした兄弟関係にある(けれど意味が違う)同義語を探しだして除外した。メンテナンスと更新、バグ修正、他のシステムへの拡張が最新のシステムでは容易になった。

28. 同義語の正確性とパフォーマンスの改善

[プロジェクト・コードネーム: Synonyms]
重複ロジックを取り除くことで同義語システムをさらに改善した。また複数の同義語の候補がある場合に適切なものをより正確に判断できるようになった。

29. 取得システムの調整

[ローンチ・コードネーム: emonga / プロジェクト・コードネーム: Optionalization]
クエリに含まれるが関連したドキュメントを返すことに必ずしも関係のない言葉をより適切に識別できるようにした。もともとのクエリにより忠実になった。

30. 行き過ぎた同義語の抑制

[ローンチ・コードネーム: zilong / プロジェクト・コードネーム: Synonyms]
ほかのキーワードに対する検索結果が入り込みすぎているというフィードバックをユーザーから受けていた。同義語システムが根本的な問題でほかのキーワードに対する結果を多くのケースで含んでいた。今回の変更により、同義語システムが、他のキーワードでの結果を強く入れすぎることなく元々の検索キーワードにウェイトを置くようにした。

31. 地理データに依存するシステムの更新

[ローンチ・コードネーム: Maestro, Maitre]
地理データに依存する指標がたくさんあり、そのうちのいくつかを更新した。

32. 名前検出の改善

[ローンチ・コードネーム: edge / プロジェクト・コードネーム: NameDetector]
名前、特に有名人の名前を検出するシステムを改善した。

33. パーソナライズ化の機能のシグナルの更新

[プロジェクト・コードネーム: PSearch]
パーソナライズ検索に使われる指標を更新した。

34. 画像検索の関連性の改善

[ローンチ・コードネーム: sib]
質の高いランディングページにある適度なサイズの画像をより適切に上位に出すように指標を更新した。

35. サイトの関連性シグナルから廃止予定だったシグナルを削除

[ローンチ・コードネーム: Freedom]
廃止予定だった、製品に焦点を置いた指標をサイトを理解するアルゴリズムから削除した。

36. 古いページのより正確な検出

[ローンチ・コードネーム: oldn23 / プロジェクト・コードネーム: Freshness]
より関連性のあるシグナルに頼ることで、インデックスにある古びたページを検出する能力を改善した。

37. オートコンプリートにおける言語検出の調整

[ローンチ・コードネーム: Dejavu / プロジェクト・コードネーム: Suggest]
一般的に、オートコンプリートは、どの言語の予測を表示するのかを決めるのに表示言語に頼っている。ほとんどの言語では、スクリプトを使用することでもユーザーが検索で使う言語を検出しようとしている。この変更でその方式を中国語と日本語、韓国語にも範囲を広げた。実質的な効果として、IMEをオフにし忘れていても英語単語を入力し始めると英語の予測が出てくる。

38. ブログ・フォーラムページに対する日付検出の改善

[ローンチ・コードネーム: fibyen / プロジェクト・コードネーム: Dates]
ブログやフォーラムの日付を決めるアルゴリズムを改善した。

39. 前に置かれる検索語のリアルタイム書き換えによるオートコンプリートの予測を増加

[ローンチ・コードネーム: Lombart / プロジェクト・コードネーム: Suggest]
この変更により、ユーザーの検索に対して潜在的にもっと適合した予測を取得するためにクエリの一部を瞬時に書き換えるようになった。同義語と最適な全体的な適合性を獲得するためのその他の機能も使う。単語の入れ替えや単語の追加、単語の削除などが前に置かれる検索語の書き換えに含まれる。

40. モバイルの拡張サイトリンク

モバイルのブラウザで拡張サイトリンクを導入し、より構成がとれた表示の優れたサイトリンクを検索結果で出すようになった。
※鈴木補足: 下のキャプチャのように縦一列のスニペット付きのサイトリンクになっています。
モバイル版メガサイトリンク

41. より正確なショートアンサー

[プロジェクト・コードネーム: Porky Pig]
ショートアンサー機能のバックグラウンドのソースをFreebaseからのデータに依存するようにアップデートした。この改良により正確さが増しバグフィックスしやすくなった。
※鈴木補足: 「ショートアンサー機能(short answers features)」は、たとえば「mount fuji elevation」(富士山の標高)と検索すると関連するページではなく「12,388 feet (3,776 m)」のようにクエリに対する回答そのものを返す機能。
「Freebase」は、Googleが買収したMateWebが開発した“エンティティ”をデータベース化するセマンティック検索を得意とした技術。

42. ビデオ詳細検索のバックエンドの移行

ビデオの詳細検索のバックエンドをメインの検索インフラに移行した。

43. 検索の*1ボタンをさらに多くの国とドメインに展開

検索結果の+1ボタンを国際化し利用できる言語と国を追加した。

44. ダブレットのローカル結果の新しいUI

タブレットでのローカル検索のユーザーインターフェイスを新たにしコンパクトで全体をざっと見しやすいようにした。

以上がサーチクオリティ ハイライトで紹介された44個の改良・変更です。
以下の7つは個別記事ですでに公式アナウンスされている改良・変更になります。

45. 世界中の目的地へのフライト検索
46. Windows Phone 7.5搭載スマートフォンアプリ検索の新デザイン
47. SSL検索のグローバル展開
48. モバイル検索の履歴機能(※鈴木補足: PCで検索したローカル検索の結果がモバイル検索にも反映される)
49. iGoogleのフルページのテーマ
50. NCAAの検索機能
51. 関数の3次元グラフ表示(※鈴木補足: こんなのこんなのが3Dでグルグル回る)

47番のSSL検索のグローバル展開はこのブログでも取り上げました(『Google、SSL検索を日本でもついにデフォルト化』)。

今日の後編には、前編にあったアンカーテキストの評価変更のように大きな話題性をもった改良は見当たりません。
しかしサイトのジャンルやキーワードによってはランキングに影響を与えそうなものもいくつか含まれています。
ユーザーとして検索が便利になる機能改善が多いように思いました。

あなたにとってインパクトのあった変更はどれですか?