Googleのレンダリング能力はここまで向上している at #SMX Advanced 2015

[レベル: 上級]

米シアトルで参加したSMX Advanced 2015では、GoogleのMaile Ohye(マイリー・オーイェ)さんがテクニカルなテーマについて講演しました。

マイリー・オーイェ

マイリーさんが触れたトピックは次の3つです。

  • HTTP/2
  • HTTPS
  • レンダリング

マイリーさんのセッションアジェンダ

この記事では、3つ目の「レンダリング」のパートをレポートします(HTTP/2は、今週のWeb担コラムでレポートしています。HTTPSは昨年とほぼ同じ内容でした)。

レンダリング能力向上の背景

Google検索のレンダリングの目標は、ユーザーがウェブページを訪問したときにブラウザで見ているものと一致させること。

レンダリングは次のことに役立つ。

  • より多くのコンテンツを正確にインデックスする
  • レイアウトを測定する(例: モバイルフレンドリー)

ページ構造はレンダリングによって保たれる。
レンダリングすることで、そのページのヘッダーやサイドバー、メインコンテンツがどこかなのかを理解できる。

見えない、隠れたコンテンツ

クリックやマウスホバーしなくても、重要なコンテンツがすぐにユーザーに見えるようにする(検索ユーザーもそのほうがいいはず)。
重要度を下げてインデックスされるので、コンテンツを隠すことには慎重になるべき。

インタースティシャルはUX的にもよくない。
インタースティシャルやオーバレイで見えないコンテンツの評価を低くすることがありうる。

URLの扱い

レンダリングによって発見されたURLはクロールされるし、PageRankを渡す。

URLs found through rendering can be crawled and passed PageRank.

アセットの数

ページのアセットの数に気を付ける。
ページのリソース(アセット)は、Googlebotによってクロールされるか、前回のクロールでキャッシュされている。
そして、サイトのクロールのキューに加えられる(製品ページや記事ページと同等に優先される)。
アセットの数を多くしすぎないようにする。

リソースへのアクセス許可

サイトで目に見えるコンテンツやレイアウトに必要な、意味を持つ埋め込みリソースへGooglebotがアクセスできるようにしておく。
コンテンツやレンダリングに関わるCSSとJavaScriptをrobots.txtでブロックしてはいけない。

RWDでの展開コンテンツ

レスポンシブウェブデザインのモバイル向けサイトで、展開式にコンテンツを隠すのは問題ない。
よく使われるデザインになってきていることをGoogleは認識している。
PC向けページのレンダリングが正規化したレンダリングといえる。

以上がGoogleの現在のレンダリングに関する情報です。
重要なポイントを終わりにまとめます。

  • Googlebotは、人間のユーザーがブラウザで見るのと同じようにウェブページをレンダリングできる
  • (HTMLのソースコードではなく)レンダリングしてできあがったページも見て評価する
  • 存在していても、レンダリング完了後に見えないコンテンツは重要度を下げることがある(インタースティシャルでコンテンツがすぐに見えない場合も同様)
  • ページを正しく評価できるように、レンダリングやコンテンツ生成に必要なCSSやJavaScriptなどのリソースをGooglebotがクロールできるように必ずしておく