ソフト404を返すページのリンクをGoogleはクロールしない

[レベル: 初級]

Soft 404(ソフト 404)を返すページに存在するリンクを Google はクロールしません。

ソフト 404 は基本的には 404 と同じ

HTTP ステータスコードでは正常にアクセスできたことを示す 200 を返すものの、ページが見つからなかったことを示す 404 を返すページとして Google が処理する URL の状態をソフト 404 と呼びます。

次のような発見をある人が Twitter で共有しました。

評価の高いリンクをクロールさせようとする 3 つのテストの結果に限れば、次のことが言える。

「ソフト 404 と判断されてしまった 200 を返すページのリンクを Google はクロールしない」

そのページ自身のランキングに加えて、内部リンクにもソフト 404 は影響しないということをこれは意味している。

Google の John Mueller(ジョン・ミューラー)氏がこの発見にコメントを返しました。

ソフト 404 は基本的には 404 だ。

豆知識: ソフト 404 は crypto 404(クリプト 404)とも呼ばれる。

ソフト 404 は、ステータスコードこそ 200 を返しますが、実質的には 404 と同じ扱いです。
つまり、インデックスされないしランキングの対象にもはなりません。

そのページにあるコンテンツが評価対象にならないのはもちろんのこと、そのページにあるリンクは(内部リンク・外部リンクを問わず)クロール対象の URL の発見には役立ちません
評価にも用いられません

一言で言えば、ソフト 404 として判断されたページは検索では無視されるということです。

新しい情報ではまったくありません。
それでも、知らない人がいても不思議ではない処理なのであらためて取り上げました。

ちなみに、Google 内部では Crypto 404 とも呼ぶようです。
リダイレクトの種類に Crypto リダイレクトというのがありました。
“Crypto” は「秘密の」とか「暗号文の」という意味ですが、「擬似的な」というニュアンスで用いられているっぽいですね。

カバレッジ レポートでソフト 404 を発見する

ソフト 404 として Google に認識されている URL が管理サイトに存在するかどうかは Search Console のカバレッジ レポートで調べられます。

ソフト 404

通常の 404 がそうであるように、通常は、ソフト 404 も、サイトのクロールやインデックス、ランキングに悪影響を与えることはありません

数件程度なら無視しても構いませんが、それでも正常な状態ではないので解消することを推奨します。
数百件以上ある場合は積極的に解消したいものです。

ソフト 404 の原因と解消

ソフト 404 が発生する原因と解消方法に関しては、検索セントラルの技術ドキュメントに詳しい説明があります。

ソフト 404 の技術ドキュメントは、以前は単独のページでしたが、HTTP ステータス コードを解説するページに少し前に統合されました。

内容はほぼ同じです。
若干の更新は、ソフト 404が発生する例の追加です。

  • サーバー側インクルード ファイルがない。
  • データベースへの接続が切断されている。
  • 内部検索結果ページが空である。
  • JavaScript ファイルがアンロードされている、または欠落している。

大量のソフト 404 がカバレッジ レポートで検出されているようなら、ドキュメントを参照して原因を特定し修正したほうがいいでしょう。