PageRankは今でも重要なのか? ~ 2010年版

PageRank テクノロジー: PageRank は、5 億の変数と 20 億以上の用語の等式を解決することでウェブ ページの重要度を客観的に測定します。 PageRank は、リンク数を数えるのではなく、ページ A からページ B へのリンクを、ページ A によるページ B への投票として解釈します。ページの重要度は、ページが受けた投票数によって決まります。

PageRank では、投票したページの重要度も考慮されます。重要度が高いページからリンクされたページも重要度が上がります。重要なページは PageRank が高くなり、検索結果の上位に表示されます。Google のテクノロジーは、ウェブ上に蓄積された情報を使用してページの重要度を決定します。検索結果にまったく人の手が加わらないことが、有料広告などに左右されない客観的な情報源としてユーザーの皆様から信頼されている理由です。

~ Google Japanの会社情報 – Google のテクノロジー より引用 ~

Google PageRankは、Googleがウェブページを評価しランキングを決定するためのもっとも有名なアルゴリズムの1つです。

Yahoo!にしてもBingにしてもPageRankと同等のアルゴリズムを採用していることは間違いありません。

Google PageRankはどのくらい重要なのでしょうか?
その重要度は今も昔も変わらないのでしょうか?

こんなスレッドをWebmasterWorldで見かけました。

これまでPageRankについてはWMWでも何度も何度もディスカッションが繰り広げられたのですが、最新版ということでピックアップします。
フォーラムアドミニストレータのtedsterのコメントを追いかけます。

200ほどある他のシグナルとともに間違いなく今でも重要だ。その中でも特に重要だが、検索によってはPR1のページがPR5のページよりも上位に来るということもいまだにある。

Googleは、2種類の異なるバケツ(鈴木注:何かを収納する入れ物の意)に入っている要因を組み合わせることによってURLの最終的なランキングを決定していると考えてみたらどうだろうか。

  • バケツ 1は、「クエリ依存の要素」を含むもので、 titleタグやバックリンクのアンカーテキスト、ユーザーの検索意図などキーワードとの関連性を測るもの
  • バケツ 2は、「クエリ非依存の要素」でPageRankやトラスト、リンクする相手の質、マルウェアの存在などの要素(鈴木注:ウェブページやサイト、ドメイン自体の評価)

最終的なランキングにはバケツ 2よりもバケツ1にウェイトが置かれている。もちろん両方とも働いてはいる。

ランダムウォーク モデル(鈴木注:リンクをウェブページの評価に結びつけるPageRankの概念の元となる理論)を作り出すのにGoogleが使う計算式はオリジナルの公式が発表されて以来何度も変わっている。そしてそれらの変更は公表されていない。たとえば推測だが、ランダムにリンクを選ぶというステップはもはや厳密にランダムではなく、代わりにウェブページのどのエリアにリンクがあるかに応じて重み付けされていると考えられる(鈴木注:たとえばサイドバーやフッターのリンクよりもメインコンテンツのリンクが評価が高いことでしょう)。もともとの公式はそんな重み付けをしていない。

今日(こんにち)Googleがページをどのくらい評価しているかを知るのに最適な指標というのは、それぞれのページをどのくらい頻繁にクローリングしているかだ。だがそれとて絶対というわけではない。なぜならめったに更新しない強いページがチェックされなくなることがたびたびあるからだ。

TBPR(ツールバーPageRank)には最低限度の価値しかないという考えには同意する。しかしそれでもなおTBPRにはいくらか価値があって、何が起こっているか全体的な傾向をおおまかに知りたいときには特にいいだろう。

ここからはPageRankに対する僕の個人的な考えです(ご意見はコメントへどうぞ)。

「PageRankは重要か?」と聞かれたら、重要でしょう。
しかし「どのくらい重要か?」と聞かれたら、Googleが内部で使っていて外部からは見えないReal PageRankを僕たちが知ることができない以上、明確な答えは出せません。

1本のリンクで渡されるPageRankは、リンク元のページ・サイト・ドメインに影響を受けているかもしれません。

tedsterもいっていたように、リンクの出現場所によっても違ってくるでしょう。
サイドバーのお気に入りからのリンクと記事中からのリンクでは評価が変わってくるのを実感している人も多いはずです。

同じページからのリンクの数、同じドメインからのリンクの数、これらによっても評価が変化していることも考えられます。
あるページから同じページへ向けて2本リンクが張られている時、1本の時よりも2倍の価値を得られるのかといったら、単純に倍ではなさそうです(Googleが最初のリンクしか評価しないかもしれない現象はアンカーテキストに対しての話)。

同じドメインから10本も20本もリンクが張られても、倍々でPageRankが渡されるとは思えません。
でも、はてブのように多数のユーザーが同じドメインの中でそれぞれディレクトリで分けられているスペースを持っている状況では、ひょっとしたら(ある程度)別ドメインのようにみなされているかもしれません。

Googleの特許を基に自分でPageRankを計算できるようになったことを誰かが得意げに語っていました。

公開されている公式が変化している今、公開されている公式だけを基にしてPageRankを算出しても「PageRankの理論を知る」という学問的な意味があるだけで、実践では役に立たないのではないでしょうか。

「机上の空論」です。

Googleには世界中からトップレベルの秀才が集まってきます。
彼らが作り出した数式を、公開されているドキュメントだけを見てしかもExcelで分析するなんてことはどう考えても非実用的でしょう。
小学生の算数ドリルではないのだから。

事実、リンクにnofollow属性が付くことでPageRankが失われるように変わった仕様は公開されている公式に合わせて計算すると矛盾が生じるのです。

踊らされたくないものです。

話を戻して、「PageRankがどのくらい重要か」はハッキリ言ってしまえばどうでもいい問題です。

重要なアルゴリズムの1つであることは間違いないのだから、PageRankを高めるために質の良いリンクを集める戦略を練るしかないのです。

Real PageRankに対して、ツールバーのPageRankはとても重要ですね。
リンクを売買する人たちにとっては。(笑)

日本ではトップページのTBPRが5以上だと、評価されるリンクが多数集まっているそれなりにトラストの高いサイトのように感覚的に思えます。

しかしTBPR3以下は更新のたびにころころ代わり、PR0⇒PR3 逆に PR3⇒PR0 なんてこともよくあるパターンなので、僕はページを判断する指標としてはまったく見ていません。

2種類の「バケツ」の話は(そのままの訳でスミマセン)、なるほどと思いました。
検索キーワードに対する関連性がより重視されるけれども、付加的にページやドメインの評価も考慮されるということでした。

強いドメインの下に作られたページは上位表示に有利だと経験したことがありますよね。
ジャマなWik***diaが代表例です。(笑)

SEO上の利点を最優先すると、サブドメインよりもサブディレクトリにサイトを展開した方が有利になることの裏付けにもなりそうです。

先日米サンタクララで開催されたSMX WestでGoogleのPeter Norvig(ピーター・ノーヴィグ)氏が、「PageRankは強調され過ぎている。今も昔も人々が思っているほど重要ではない」と発言したそうです。

アンタたちがツールバーにPageRankを表示したのがそもそもの始まりだろとツッコミたくなりますが、PageRankがすべてではないということは理解しておかなければなりませんね。

【追記】
この記事は昨日書き終えたのですが、この後にStome Temple ConsutltingのEric Enge(エリック・エンゲ)氏がGoogleのMatt Cutts(マット・カッツ)氏を相手にしたインタビュー記事を公開しました。

インタビューの中でMatt Cutts氏はPageRankとクローリングの関係について次のようにコメントしています。

“僕たちがクロールするページの数はだいたいPageRankと比例している。ルートページにたくさんの被リンクを集めていれば、確実にクロールするだろう。ルートページが他の内部ページにリンクしていればそれらのページもPageRankを得ることになるから、同じようにクロールするだろう。だけどサイトの階層が深くなれば深くなるほどPageRankは減少していく傾向にある。”

ウェブページのクロールにはPageRank(TBPRではなくReal PageRank)が深く関わっているということですね。

このインタビューには他にも有益な情報が詰まっています。
ブログかWeb担のどちらかでサマライズしようと思います。