Googleのセマンティックはここまで向上している 〜 意味が同じ言葉を検索結果で太字表示

[対象: 上級]

ものごとの意味を理解すること、いわゆるセマンティックの領域におけるGoogleの能力が著しく向上している事実をこの記事では紹介します。

検索クエリに一致していないワードであっても意味的に同じワードをGoogleが太字(ボールド)で表示している例をMark Traphagen(マーク・トラファーゲン)氏が発見しGoogle+に投稿しました。
Googleのセマンティック能力の進歩を裏付ける格好の具体例でした。

似た事例を日本語の検索で僕も見つけたので紹介します。

Googleが意味的に同じ言葉をボールド表示する例

「取り除く」と「除去」「除去」

下は、「Google 不自然リンク 取り除く」の検索結果です。

「取り除く」で「削除」「除去」がボールド

赤の矢印が指している「取り除く」が太字になっているのはいつもどおりです。

ところが緑の矢印が指している「除去」と「削除」も太字になっています。
「除去」も「削除」も検索クエリには含まれていません。

しかし、どちらも「取り除く」と同じ意味を持っています。
僕たち大人の人間にとっては当たり前のように解釈できたとしてもコンピュータにとっては難しいことでした。
でも今のGoogleにとってはたやすいことです。

とはいえ、これらは同義語だから同義語辞書があればさほど難しくはないとも言えます。

もう1つ別の例を見てみましょう。

「削除不可能」と「解除できない」

下は、「Google 不自然リンク 削除不可能」の検索結果です。

「削除不可能」で「解除できない」がボールド

赤の矢印が指している「解除できない」が太字になっています。

「削除」と「解除」は、このクエリに関して言えば、同じ意味を持ちます。
ですが、どんな文脈においても同じ意味を持つとは限りませんね。

「大雪警報を解除する」とは言いますが「大雪警報を削除する」とは言いません。

不自然リンクがコンテキストだから同じ意味を持つのです。
つまりGoogleはコンテキストを理解できています。

そして「不可能」に対して「できない」が太字になっています。
たしかにどちらも同じ意味を持ちます。
ただこれは単語レベルの同義語というよりも、その意味を本当に理解していないと同一視できない言葉ではないでしょうか。

面白いのは、緑の矢印が指している「削除出来ない」が太字になっていない点です。
「削除」はクエリに含まれています。
「出来ない」と漢字で書くと意味が理解できなくなるのでしょうか?

理解はしているけれど、単に太字になっていないのでしょうか?

あるいは分けずに「削除不可能」と「解除できない」をそれぞれひとかたまりとして同じ意味だと理解しているのかもしれません(興味があれば調べてみてください)。

いずれにしても、2つの例からわかるようにGoogleのセマンティックの能力が飛躍的に伸びていることは確かです。

ユーザーのために情報量豊富なコンテンツを作り続ける

クエリに含まれていなくても同じ意味を持つワードが検索結果でボールド表示するのはずいぶん前からです。
たとえば、英語表記の「Google」であっても日本語表記の「グーグル」も太字になります。
【訂正】日本語表記の「グーグル」であっても英語表記の「Google」も太字になります(「Google」では「グーグル」は太字になりません)。

しかし最近は「Googleはここまでわかってるんだ」というボールド表示の例をたくさん目にするようになりました。
SEO好きな人はきっと気付いているはずです。

より確実にGoogleが意味を理解できるようになってきていることは、ユーザーに役立つコンテンツをこつこつと作ってきた僕たちにとって嬉しい発展ですね。

わかりやすい情報量豊富なコンテンツを今後も増やし続け、Googleのさらなる進歩に期待しましょう。