Google検索でのBERTはクエリ解釈だけではなくコンテンツ理解にも使われる #GWCPS

[レベル: 上級]

BERT と呼ぶ自然言語処理技術を検索システムに採用したことを Google は先日発表しました。

クエリの解釈だけではなくコンテンツの理解にも BERT は使われます。

今のところ、米 Google の英語の検索だけに BERT は用いられています。
ほかの国・言語への展開は、英語でのデータが集まり、それぞれの国・言語で十分に評価してからになります。

Google エンジニアが BERT について語る

Webmaster Conference Mountain View

米 Google 本社があるマウンテンビューで 11 月 4 日に開催された Webmaster Conference Mountain View に参加してきました。

Google 検索の上級エンジニアも来ていて、セッション後の Q&A の時間と直接に BERT について聞くことができました。
この記事で共有します。

BERT はコンテンツ理解にも使われる

検索での BERT の利用が始まったことを伝える公式アナウンスを読むと、BERT は検索クエリの理解を劇的に向上させたことが説明されています。

クエリだけではなく、ページに書かれているテキストコンテンツの理解にも BERT は使われているのでしょうか?
公式アナウンスでは明確には言及されていません。

上級エンジニアの Google 社員に直接尋ねたところ “YES” という答えが返ってきました。
BERT はコンテンツの理解にも用いられます。
つまり、BERT によって僕たちが書いた記事をより的確に理解してもらえます。

日本への導入はいつか?

セッション後の Q&A タイムでは、なぜ米 Google での英語検索だけのか、ほかの言語・国への導入は予定はどうなっているのかを尋ねました。

次のような説明を得ました。

まず、英語で運用して BERT 検索のデータを集める。ほかの言語に展開するには十分にトレーニングする必要があるし、評価に時間をかけなければならない。

また、BERT の利用はコンピューティングのリソースを大量に消費する(から、簡単には大規模に展開できない)。

とはいえ、ほかの言語への展開はそんなに長い時間はかからないと思う。

まずは、米 Google の英語検索で効果を確かめたうえで、ほかの言語での評価を入念に行うということです。

米国・英語以外の展開にはそんなに長い時間はかからないだろとのことですが、当然のことながら明確な予定については触れませんでした。
ただ、1 年も 2 年も先の話になることはないのではないかというのが僕の個人的な感想です。

補足しておきますが、強調スニペットに関しては、導入されているすべての言語(日本語も含む)で BERT がすでに使われています。
ウェブ検索結果での BERT の採用についてここでは話しています。

さて、BERT が使われていてもいなくてもユーザーのために役立つコンテンツを読みやすくわかりやすく作るという僕たちの姿勢は変わりません。
それでも、Google のクエリ解釈・コンテンツ理解の能力が向上すればするほど、ユーザー目線にたってコンテンツを提供してきた僕たちにはプラスの影響しかありません。

ユーザーファーストとは言っても、結局はリンクでしょ、ページ数でしょ、文字量でしょという時代が終りを告げていくのは歓迎すべきことです。