不自然リンク検出アルゴリズムの強化やtitleタグ書き換えの改良など、5月に実行した39個の検索品質改善をGoogleが公表

[対象: 中級]

Googleは、先月に実行した検索品質改善をInside Searchブログで公表しました。

毎月恒例となっているSearch quality highlights(サーチクオリティ・ハイライト)シリーズの2012年5月度版になります。
全部で39個の改善・改良を今回は紹介しています。

Googleが5月に実行した39個の検索品質改善

1. 深い階層のハッキングされたページの検出

[ローンチ・コードネーム: GPGB / プロジェクト・コードネーム: Page Quality]
ハッキングされたサイトの検索結果に「このサイトは危険にさらされている可能性があります」と表示することがある。これまではホームページに対してだけだったが下層のページにも拡大した。

2. オートコンプリート予測を検索結果の調整として利用

[ローンチ・コードネーム: Alaska / プロジェクト・コードネーム: Refinements]
オートコンプリートは、検索ボックスにキーワードを入力した時に出てくる検索キーワードの候補。検索した後に出てくる「関連する検索キーワード」にもこのオートコンプリートの予測を利用するようになった。

3. 日本語ユーザーへのより多くの予測

[プロジェクト・コードネーム: Autocomplete]
ユーザビリティテストで日本語ユーザーは他の言語ユーザーよりもオートコンプリートをよく利用することが分かった。日本ではオートコンプリートの候補の数を最大8個まで増やした(インスタント検索がONのとき)。

4. モバイルでのオートコンプリートの改善

[ローンチ・コードネーム: Lookahead / プロジェクト・コードネーム: Mobile]
キャッシュ機能の強化によりモバイルネットワークでのオートコンプリート予測を速くした。

5. 無原則な予測の減少

[ローンチ・コードネーム: Axis5 / プロジェクト・コードネーム: Autocomplete]
オートコンプリートで質の低い予測が出てこないようにした。

6. オートコンプリートにおけるIME処理の向上

[ローンチ・コードネーム: ime9 / プロジェクト・コードネーム: Translation and Internationalization]
オートコンプリートにおけるIMEの処理を改善した。CAPS Lockのサポートやユーザーの使用言語に基づいたより適切な処理を含む。

7. アジア言語のため新しい、語の区切り方

[ローンチ・コードネーム: BeautifulMind]
日本語と中国語、韓国語における自然会話での語の区切り方を更新し、これらの言語のテキストをより適切に理解できるようになった。

8. ユニバーサル検索でのGoogleブックスに対するスコアリングとインフラストラクチャの改善

[ローンチ・コードネーム: Utgo / プロジェクト・コードネーム: Indexing]
ウェブ検索で使う、配信とスコアリングのインフラストラクチャにスキャンした本の数十億のページを統合した。

9. サッカー機能の統合

[プロジェクト・コードネーム: Answers]
スペインとイングランド、ドイツ、イタリアを横断してサッカー検索できるようにした。

10. NBA検索機能の改善

[プロジェクト・コードネーム: Answers]
関係するNBAの得点結果と情報を検索結果の上部にもっと多く返すようにした。

11. ゴルフ検索の新しい機能

[プロジェクト・コードネーム: Answers]
プロゴルフ協会 (PGA) とPGAツアーに対する新しい機能を導入した。

12. ニュース検索結果のランキング改善

[プロジェクト・コードネーム: News]
メインの検索結果に出てくるニュースコンテンツを順位付けするシグナルを改良した。以前よりも素早くニュースを発見するのに役立つ。

13. 不自然なバックリンクを発見するためのシグナルのより優れた適用

[ローンチ・コードネーム: improv-fix / プロジェクト・コードネーム: Page Quality]
よくあるスパムのテクニックである、さまざまなタイプのリンクプログラムを検出するアルゴリズムをGoogleは取り入れている。これらのシグナルを残りのランキングにも適切に利用することを今回の変更で確実なものにした。

14. ペンギンの改善

[ローンチ・コードネーム: twref2 / プロジェクト・コードネーム: Page Quality]
ペンギンのアルゴリズムによって使われるシグナルの改善とデータの更新のための2つの小さな調整を展開した。

15. HTMLのタイトルが省略されるときの代わりになるタイトルの発動条件

[ローンチ・コードネーム: tomwaits / プロジェクト・コードネーム: Snippets]
より適切なタイトルを表示するためにアルゴリズムによって現在のtitleタグが長いときは省略された簡潔なタイトルを検索結果に表示する。短くなった新しいタイトルが、元のタイトルと同じくらい正確に意味を伝えるときだけにこれを適用するようにした。

16. 代替タイトル生成の効率改善

[ローンチ・コードネーム: TopOfTheRock / プロジェクト・コードネーム: Snippets]
この変更によりタイトルを生成するシステムの効率が向上し、結果としてCPUの使用を大きく節約し検索結果でもっと明確なタイトルが実際に表示されるようになった。

17. 代替タイトル生成におけるテンプレート的なアンカーテキストのより適切な格下げ

[ローンチ・コードネーム: otisredding / プロジェクト・コードネーム: Snippets]
検索結果にタイトルを表示するときは、ページを適切に表していない「戻る」のようなテンプレート的なコピーを使いたくない。このような有用でないテキストを使わなくすることに対してこの変更は役に立つ。

18. 音楽リッチスニペットの国際対応

[ローンチ・コードネーム: the kids are disco dancing / プロジェクト・コードネーム: Snippets]
Google.comだけで導入されていた音楽のリッチスニペットが世界中のGoogleで利用できるようになった。

19. モバイルでの音楽リッチスニペット

[ロジェクト・コードネーム: Snippets]
音楽リッチスニペットをモバイルでも始めた。

20. セーフサーチ改善の国際対応

[ローンチ・コードネーム: GentleWorld / プロジェクト・コードネーム: SafeSearch]
アダルトコンテンツと通常のコンテンツの境目にある結果を処理するために設計されたアルゴリズムを国際対応した。

21. 用語スコアリングのアルゴリズムの単純化

[ローンチ・コードネーム: ROLL / プロジェクト・コードネーム: Query Understanding]
この変更で質において最小限のコストでいくつかのコードを単純化した。コードの読みやすさを改善するための大規模な取り組みの一部。

22. 白にフェードアウトするインスタント検索結果

[プロジェクト・コードネーム: Google Instant]
結果のあるページからないページヘ移動するときにわずかなフェードアウトを加えた。

23. メジャーな新しいニュースのより良い検出

[プロジェクト・コードネーム: Freshness]
大きな出来事が起こった数秒後にはリアルタイムで最新のウェブ検索結果を確実に返すようになった。

24. 新しさのためのよりスムースなランキング作用

[ローンチ・コードネーム: flsp / プロジェクト・コードネーム: Freshness]
新しいドキュメントを識別するために使われるいくつかのしきい値をもっと継続的な作用と置き換えた。

25. 新しいコンテンツを探すユーザーのより適切な検出

[ローンチ・コードネーム: Pineapples / プロジェクト・コードネーム: Freshness]
新しいコンテンツを探していそうな検索を検出するのに役立つまったく新しい分類子を導入した。

26. フレッシュネス・アルゴリズムの単純化

[ローンチ・コードネーム: febofu / プロジェクト・コードネーム: Freshness]
新しいコンテンツを評価するフレッシュネス・アルゴリズムに対する単純化を展開しバグの理解とシグナルの調整が容易になった。

27. 右パネルのGoogle+ページの更新

[プロジェクト・コードネーム: Social Search]
検索結果の右パネルに表示するGoogle+ページと検索クエリとの関連性を判断するシグナルを改善した。

28. ランキングアルゴリズムのパフォーマンス最適化

[ローンチ・コードネーム: DropSmallCFeature]
検索結果の質に与えるインパクトを最小限にしてスコアリングのインフラストラクチャの効率を著しく改善できた。

29. 多様なドメインからの結果を返すためのよりシンプルなロジック

[ローンチ・コードネーム: hc1 / プロジェクト・コードネーム: Other Ranking Components]
ユーザーのクエリに関連すると判断したときに、多様なドメインからの結果を返すことを手助けするアルゴリズムがある。これらのアルゴリズムの裏側にあるロジックを単純化した。

30. タブレットで正確な場所を選ぶオプション

[プロジェクト・コードネーム: Mobile]
今いる正確な場所に関連する結果を表示するためのパーソナライズのオプションがしばらく前からモバイルでは利用できた。この機能をタブレットにも拡大した。検索のホームページの下にはリンクが、ローカル検索結果の下にはボタンが見える。

31. タブレットでのローカル検索の改善

[プロジェクト・コードネーム: Mobile]
モバイル同様にタブレットでもローカル結果でその場所の詳細を簡単に見ることができるようになった。ローカル結果に出てくるレビューをタップすれば、地図やレビュー、メニューへリンク、予約へのリンク、開店時間などを見ることができる。

32. モバイルでの「最近」の機能の国際対応

[ローンチ・コードネーム: Xirtam3 / プロジェクト・コードネーム: Categorize]
最近検索したお店や場所を探しやすくする「最近」の機能をインターナショナルで展開した。

ここまでが今回の記事で公表された改善で32個あります。
残りの7個は個別記事として公表済みです。

  1. Knowledge Graph(ナレッジ・グラフ)
  2. 中国本土でのよりよい検索
  3. DNSChangerマルウェアに感染したユーザーへの通知
  4. Google+ローカル ※このブログで解説済み
  5. モバイルでのローカル検索の改善
  6. Googleマップモバイル6.7
  7. iPhoneのGoogle検索アプリのアップデート

僕の目をいちばん引いたのは13番の不自然リンク検出アルゴリズムの別の分野への適用ですね。
ランキングを操作するための作為的なリンクが一段と通用しなくなってくることでしょう。

次に目を引いたのは15〜17番のtitleタグの書き換えについてです。
まったく望まないタイトルに勝手に書き換えられクレームが多くありましたが最近はほとんど聞かなくなりました。
改善を続けている証拠と言えそうです。

7番は意外と見過ごすことのできない改良かもしれません。
日本語と中国語、韓国語のおける語と語の区切りを理解するアルゴリズムを更新したとのことです。
たぶん、いわゆる形態素のことかもしれません。

日本語と中国語、韓国語といえばパンダアップデートで取り残されている3言語です。

この改良がパンダ・アップデートの日本導入に繋がると嬉しいのですがどうでしょう。