ウェブページを役割・目的に応じて分割し理解する特許をGoogleが取得

現在の一般的なウェブページは、ヘッダー・サイドバー・メインコンテンツ・フッターのように役割や目的ごとに分割されていて、どのページも構成が同じです。

いわゆるテンプレートが決まってます。
※ちなみにSEOの用語では、テンプレートのことを「ボイラープレート(boilerplate)」と呼ぶことがあります。

ボイラープレートはパターンが決まっているので、ここはヘッダー画像、ここはサイドバーのナビゲーションメニュー、ここはフッターリンク、ここはメイン記事と識別するのは人間のユーザーにとってはさほど難しいことではありません。

もしあなたが僕のブログのリピーターだったら、訪問して真っ先に見るのはきっと今まさに見ている記事部分でしょう。
毎日毎日ヘッダーのロゴやフッターのコピーライトを注意を払って見たりしないはずです。

どのエリアやパーツがどんな役割や目的を持っているか、そしてどのくらい大切なのかを理解できているからですね。

このようにウェブページを分割、セグメント化して理解するための特許をGoogleが取得しました。

この特許で書かれた仕組みは、ページのHTMLソースや、ページ内のそれぞれのパーツがブラウザで表示したときにどのように見えるか、目的が何か、どの場所に位置しているかを見ています。

特許に書かれている、ウェブページをセグメント化する仕組みによってどんなことが実現できるのかをSEO by the SeaのBill Slawski(ビル・スロースキ)氏が解説しているので、ポイントを紹介します。

  • リンク分析
    目的が明らかに違う場所のリンクには異なる比重が置かれるかもしれない。たとえばフッターに置かれたリンクはページ内のもっと重要な場所に置かれたリンクほど重要視されないかもしれない。
  • テキスト分析
    ある場所に現れるテキストは別の場所に現れるテキストよりも重要視されるかもしれない。たとえば、メインコンテンツのようにページ内でより重要な場所にテキストが書かれているページは、フッターに書かれたページよりもそのテキストでの検索に対して上位に表示されるかもしれない。
  • 画像の説明
    画像の近くに書かれているテキストは離れているテキストよりも通常はその画像と関連性が高い。セグメント化することで画像により近いテキストを認識でき、画像検索の説明やランキングに役立てられるかもしれない。
  • スニペット生成
    スニペットはmeta descriptionタグの記述以外にもウェブページのコンテンツから取得されることがある。セグメント化することにより、検索キーワードにもっとも関連性の高いテキストに基づいてスニペットを生成できるかもしれない。

ウェブページをセグメント化する仕組みについては以前にも取り上げたことがあります。

しかしGoogleがセグメント化の技術について本格的に説明しているのは今日紹介した特許が初めてだとのことです。

新しいHTML5では、headerやfooter、articleといった要素で役割を定義できるので検索エンジンにとってはセグメント化しやすくなるだろうとBill Slawski氏は付け加えています。

この特許が実際の検索アルゴリズムに実装されれば、重要な要素はHTMLの上部に置くといったテクニック的なSEOが不要になるだろうし、受け渡すPageRankの量をリンクの属性によって変化させる“Reasonable Surfer”(リーズナブル・サーファー)モデルがより真実味を帯びてきそうです。