ログインが必要なコンテンツに対するSEOはどうすべきか?

[レベル: 中級]

Search Off the Record ポッドキャストのエピソード 99 では、ログインが必要なウェブサイトに SEO が必要かどうかについて John Mueller(ジョン・ミューラー)氏と Martin Splitt(マーティン・スプリット)氏がディスカッションしました。

インデックスさせたいコンテンツにはペイウォール用の構造化データを活用する方法や、非公開コンテンツはマーケティングページへリダイレクトする方法など、複数の戦略が紹介されています。
さらに、よくある落とし穴や技術的なリスクを取り上げ、検索パフォーマンスを最適化するための実践的なアドバイスも 2 人は示しました。

主要ポイント

ポッドキャストで話し合われた内容の主要なポイントは次のとおりです。

  • ログインが必要なコンテンツに SEO が必要かどうかは、検索結果に何を表示・インデックスさせたいかという目標によって変わる。
  • ペイウォールや制限付きコンテンツをインデックスさせたい場合は、Googlebot には完全なコンテンツを配信し、一般ユーザーにはペイウォールを提示する。ペイウォール用の構造化データで「誰でも自由に閲覧できるわけではない」ことを明示する。
  • ペイウォール実装時は、制限されたコンテンツを非ログインユーザーのページの DOM に事前読み込みしないこと(スクリーンリーダー等からの漏洩を防ぐため)。
  • インデックスさせたくない非公開コンテンツ(例: Google Drive、Search Console)に対しは、認証されていないユーザーを汎用ログイン画面ではなく、マーケティングページやコンテキスト固有のランディングページへリダイレクトするのが効果的。
  • すべての非公開 URL が単一の汎用ログインページにリダイレクトされると、検索エンジンはそれらを重複とみなし、そのログインページのみをインデックスする可能性がある。これを避けるには、各ログインページやランディングページにサービス固有の情報を加え、独自性を持たせる必要がある。
  • robots.txt でブロックしないこと。 robots.txt でクロールを拒否しても URL は検索結果に出る可能性があり、ユーザー名やメールアドレスといった機密情報が漏洩するリスクがある。代わりに noindex タグやリダイレクトを使う。
  • 社内イントラネットや社員専用サービスのログインページは原則インデックス不要。noindex やサーバーサイド認証、エラーページを返すことで意図しない露出を防ぐ。
  • URL 設計に注意する。 ユーザー名やメールアドレスなどの個人情報をURLに含めない。これらがインデックスされる恐れがあるため。
  • セキュリティ上の観点から、すべての認証を login.domain.com のような専用ドメインにまとめ、Cookie 管理やアクセス制御を行う方法もある。
  • 「想定外」もあり得る。 一度公開したコンテンツ(例: Google ドキュメント)を非公開に戻しても、再クロールまでインデックスに残り続ける可能性がある。
  • サイトを監査する際は、シークレットモードで自社サービス名や特定の URL パターン(例: 注文履歴ページや会員専用ダッシュボード)を検索し、非ログインユーザーの体験を確認する。
  • 問題が見つかった場合は、Search Console の URL 検査ツールを利用して Google がどのようにページを認識しているかを確認し、改善計画を立てる。

◆◆◆
ログインが必要なページに関しては、ログイン先を検索結果に表示させたいのかさせたくないのかによって対処が変わってきます。
ポッドキャストでの解説を参考にして設定しましょう。