グーグルの特許に見るリンクと時間の関係(2)

Googleが更新した「Information retrieval based on historical data」という特許の解説の2回目です。

前回は、「リンクにより判断するウェブページの新しさ(Freshness)」を取り上げました。

今回は、リンクのFreshnessについてです。

特許によれば、Googleはリンクそのものの評価にも、時間を取り入れています。


リンクの「Freshness」の度合いを決める基準として、次の3つの例が挙げられます。

  1. リンクが出現あるいは変更された日付
  2. リンクに関連付けられたアンカーテキストが出現あるいは変更された日付
  3. リンクを含むウェブページが出現あるいは変更された日付

リンクが依然として関連性があって有益ならば、ウェブページが更新されてもそのまま残っているだろうという理論から、3番目のリンクを含むウェブページの出現・変更の日付が、「Freshness」をより的確に指し示す指標と考られます。

ただし、ほんのわずかなウェブページの修正がリンクのFreshnessに結びつくことがないように、大きな変更だけがリンクのFreshnessに影響を与えます。

大きな変更とは、たとえばウェブページの大部分の変更だったり、たくさんのいろんな箇所の変更です。


僕なりの解釈を述べます。
例によって、理解不足があればご指摘を。

Googleはウェブページだけではなく、リンクそのものにも年齢を与えています。

僕は、ドメインエイジのようにリンクも古ければ古いほど価値があるのかと考えていましたが、必ずしもそうではないようですね。

新しいリンクの方が、評価が高い場合もあります。
(今後の解説で、詳しく説明します)

リンクがFreshかどうか(今求められている情報にふさわしいかどうか)を判断するのには、「リンクの貼られた(“張”られたではない)ウェブページが出現した、もしくは変更された日付」が最も適しています。

なぜなら、消えないということは、依然として有益な情報を提供しているリンクだとみなされるからです。
(これも後で出てきますが、「新着」のように日々変わるリンクは評価が低くなります)

ページの新しさがリンクのFreshness(Fresh度)を表すといっても、フッターの一部を変えたり、単語をいくつか変えたりしてもそれは、変更とはみなされません。

姑息な技を使ってもサーチエンジンはだませないということですね。
(ページ更新を装って、定期的に一部分を自動で変えるツールが売られてますが、効果はいかほどなんでしょうか?)