GoogleのHTTPSアルゴリズムはURLの最初の5文字を見ている、混在するコンテンツがあっても優遇される

[レベル: 上級]

検索結果で、HTTPSページを(多少)優遇するアルゴリズムをGoogleは採用しています。

このアルゴリズムは、完全に安全な通信ができているかどうかや証明書の有効性を厳密には考慮せず、HTTPSで通信できていさえすれば基本的には優遇を受けられるとのことです。

GoogleのGary Illyes(ゲイリー・イリェーシュ)氏が、Marketing Landとのインタビューのなかで明らかにしました。

“https”で始まりさえすればいい

HTTPSアルゴリズムについて、イリェーシュ氏は次のように説明しました。

最初の5文字 (h, t, t, p, s) に基いている。

「本物の証明書でなくてもいいのか?」という問いに対しては、このように答えています。

URLの最初にある5文字を基本的には見ている。それが https であり、検索結果に表示されることができているなら、最小限の優遇を得ている。

つまり、HTTPSとして完全に成立していなくても、HTTPSアルゴリズムによる優遇を受けられることがあるというのです。
少なくとも https: のURLでアクセスできていて、そのURLが検索結果に出ていさえすればいいのです。

証明書エラーも混在するコンテンツも問題にならない?

ヘルプ記事にもあるように、サイトのホスト名が証明書のサブジェクト名と一致しなかったり証明書が自己署名になっていたりするなど、証明書に関するいくつかの問題が発生していた場合は、Search Consoleに警告が届くことがあります。

しかし、この場合でも検索結果に選ばれているURLが https であれば、HTTPSページとしてGoogleに認められていることになりそうです。

HTTPSページなのに、HTTPで配信されるコンテンツが混ざっていると「混在するコンテンツ (Mixed Content) 」として判断され、ブラウザでは鍵マークが付きません。

たとえば、こちらのページはHTTPSですがHTTPで配信するアフィリエイト広告が掲載されています。
そのためブラウザでは鍵マークが付かず、Chromeのセキュリティパネルでは、Mixed Contentの指摘が出ます(知り合いの永江さんのサイトのページを勝手に例に使いました。よく見てるブログです😃)。

HTTPSだけど鍵マークなし

Mixed Content

HTTPSとしては問題があるのですが、Googleには https でインデックスされており、https の5文字で始まるURLでこの記事は検索結果に出てきます。

検索結果ではHTTPS

したがって、HTTPSアルゴリズムによる優遇を受けることができていると考えられます。

【UPDATE】現在は修正済みで、完全なHTTPSになっています。

HTTPS優遇が適用されているかどうかは、インデックスされているURLがどうなっているかどうかで僕たちには判断できるということになりそうです。
HTTPSにしているはずなのに、http のURLで検索結果に表示されたとしたら優遇は受けていません。

GoogleのJohn Mueller(ジョン・ミューラー)氏もそのように言っています。

検索結果でURLをHTTPSで私たちが表示していないなら、優遇を得ていないだろう。

HTTPS優遇を受けていても、完全なHTTPSで配信する

完全なHTTPS通信が確立できているページだけに優遇を適用することもGoogleにはできるのでしょうが、たくさんの長い話し合いの結果、結局この仕様に決まったとのことです。

現在のHTTPSアルゴリズムにおいては、多少の問題があっても、ランキング優遇の恩恵を得ることができます。
とはいっても、せっかくHTTPSで配信しているのですから完全なHTTPSを目指すようにしましょう。

僕たちがHTTPSを採用するいちばんの目的は、Googleからの評価を高めるためではなくユーザーのセキュリティとプライバシーを保護するためです。:)