noindexページはコアウェブバイタルが計測されない!?

[レベル: 中級]

コア ウェブ バイタルに含まれるには、Google 検索にインデックス可能ページである必要があります。
逆に言うと、インデックスできないページはコア ウェブ バイタルのデータが取得されません。

noindex ページは CWV から除外

コア ウェブ バイタルのデータのソースとなる Chrome ユーザー エクスペリエンス レポート (CrUX) に含まれるためには、そのページは Google 検索にインデックス可能でなければなりません

次の条件に当てはまるページは、コア ウェブ バイタルの対象外です。

  • 200 以外の HTTP ステータスコードを返す
  • X-Robots-Tag: noindex (とそれに相当する)HTTP ヘッダーを返す
  • noindex robots meta タグ(とそれに相当する)タグが HTML に記述されている

404 を返すページや noindex ページは CrUX に含まれません。
したがって、コア ウェブ バイタルの対象外です。
例に挙がっていませんが、robots.txt でブロックされたページも除外されるでしょう。

オリジンページもインデックス可能でなければならない

コア ウェブ バイタルに含まれるためのインデックス可能条件はオリジンページにも当てはまります。

オリジンページは一般的にはトップページを指します。
このブログであれば、www.suzukikenichi.com です。

インデックスできない状態のオリジンページのコア ウェブ バイタルはデータセットには含まれません。

オリジンデータには、インデックスされないページの CWV も含まれる

インデックス可能であることがコア ウェブ バイタルのデータセットに含まれる条件ですが、これはページ単位のコア ウェブ バイタルに適用されます。

オリジンページがインデックス可能でありさえすれば、オリジンデータ(≒サイト全体のデータ)にはインデックスできないページのコア ウェブ バイタルも含まれます

まとめるとこうなります。

  • 個々のページのコア ウェブ バイタル: インデックス可能であること
  • オリジンページ(トップページ)のコア ウェブ バイタル: インデックス可能であること
  • オリジンデータ(サイト全体のデータ): インデックスできないページも対象。ただしオリジンページがインデックス可能であること

ドキュメントとして発行

ページレベルのコア ウェブ バイタルのデータは、一般公開されているインデックス可能なページから取得されるというのは以前からそうです。

コア ウェブ バイタルによくある質問の第 2 弾で次のように Google は説明しています。

Q: noindex ページや「robots.txt でブロックされた」ページは CrUX データセットに含まれますか?
A: CrUX データには次の 2 通りの方法でアクセスできます。PSI や CrUX API を介したページレベル、または Big Query の一般公開データセットを介したオリジンレベルでアクセスできます。前者はトラフィックのしきい値を満たす一般公開のインデックス登録済みページの情報のみを表示しますが、後者にはすべての公開および非公開ページからの集計データが含まれる場合があります。

📝強調は僕による

CrUX のデータ取得方法に関して詳しく説明するドキュメントが 1 か月ほど前に発行されました。
このドキュメントに、インデックス可能であることも含めてより詳細な解説が書かれています。

コア ウェブ バイタル改善に余念がない人はひととおり目を通しておくといいでしょう。