Googleで、URLの長さは問題にならないが階層の深さは重要 from #SMX Advanced 2015

[レベル: 全員]

Google検索において、URLの長さは問題にはなりません。
しかしURLのディレクトリの階層の深さは、URLの発見において重要な要素になります。

Googlebotクン

Googleのイリーズ氏がSMXで言ったこと

GoogleのGary Illyes(ゲイリー・イリーズ)氏はSMX Advanced 2015のQ&Aセッションで、URL構造についての質問に回答しました。
僕はレポート記事で次のように書きました。

URLの長さはランキングには関係しない。
しかしURLの発見に役立つことがある。

1つ目はともかくとして、2つ目の「URLの発見に役立つことがある」はどういうことを言っていたのか明確ではありませんでした。
イリーズ氏の発言をすべてはっきりと聞き取ることができなかったことが原因です。

もやもやしていたので、レポート記事を書いた後にイリーズ氏に確認しました。
また、その場にいたJenniffer Slegg(ジェニファー・スレッグ)氏がTheSEMPostにこの件に関して記事を書いています。

イリーズ氏からの説明とTheSEMPostの記事をもとに、GoogleのURL構造の扱いをまとめます。

URLの長さは問題にならない

URLの長さはGoogleにとっては重要ではありません。
短いからいい、長いから悪いとはなりません。

GoogleのJohn Mueller(ジョン・ミューラー)氏は、URLは2,000文字以内に収めるようにとかつて推奨したことがあります。
2,000文字という制限は、Internet Explorerで扱えるURL文字長が2083文字だからだと推測されます。
普通にやっていれば、2,000文字を超えることはないでしょうからURLが長すぎるかどうかを心配する必要はないでしょう。

とはいえ、ユーザーには短いほうが覚えてもらいやすいかもしれません。
また検索結果のクリック率はURLが短いほうが高いというような話を聞いたことがあります(聞いただけですが)。

URLの階層は問題になる

一方で、URLの階層は問題になります。
含まれるディレクトリが少ないほうが重要視されるとのことです。

次のようにイリーズ氏は僕に説明してくれました。

What I meant is that it’s a signal for us how far a page is from the root. For instance, we know that example.com/ is important, so example.com/animals/ must be less important, and example.com/animals/puppies/ even less important.

ルートからどのくらい離れているかをシグナルにしているということを僕は言っていたんだ。たとえば、example.com/ は重要だとわかっている。example.com/animals/ はそれよりは重要じゃなくなる。example.com/animals/puppies/ はさらに重要じゃなくなる。

ここでいう「重要」は、評価が高い、言い換えれば上位表示に役立つという意味ではありません。
URLの発見において重要だということです。

階層が浅いほうが、先に発見してもらえるということです。

次の3つのURLにGooglebotが初めて出会ったとしたら、上から優先的に最初のクロールを実行するということなんだろうと僕は解釈します。

  1. example.com/
  2. example.com/animals/
  3. example.com/animals/puppies/

ということで、URL構造、別の言い方をするとディレクトリ階層の数はURLの発見に重要です。
ルートに近いほど、つまり階層が浅いほど重要視されます。

といっても、普段の運用で気にするようなものではないのかなとも僕は思います。
100個も200個もディレクトリで区切られていれば何らかの影響が出るのかもしれませんが、3、4個くらいならルートURLとの差異を感じるほどではないんじゃないでしょうか?

【UPDATE】
サイトマップのヘルプ記事に次のような説明があることを、読者のはるかさんがコメントで教えてくれました。

サイトのページが適切にリンクされていれば、通常 Google のウェブクローラはサイトのほとんどのページを検出できます。それでも、特にサイトが次のいずれかの条件に該当する場合には、サイトのクロールを改善する手段としてサイトマップが役立ちます。

  • サイトのサイズが非常に大きい。 その場合、新しいページや更新されたばかりのページの一部が Google のウェブクローラによるクロール対象から漏れることがあります。

ものすごく規模が大きいサイトでものすごい数のページが短期間に公開されるような状況では、ディレクトリ階層が浅いURLから先にクロールを始め、反対にディレクトリ階層が深いURLは後回しになって「クロール対象から漏れること」がひょっとしたらあるのかもしれませんね。

いずれにしても、記事の最後に書いたように一般的なサイトでは気にかける必要はないでしょう。
間違っても、イリーズ氏の発言を理由にしてURLを変更してまでディレクトリの数を減らすような真似はしないでください。