Google Proxy Hacking(グーグル プロキシ ハッキング)-あなたのページが乗っ取られる?

Googleのインデックス アルゴリズムのバグで、あなたのウェブサイトが乗っ取られる危険性があります。

アメリカで有名な、Dan Thies(ダン・シーズ)というSEOエキスパートが、「Google Proxy Hacking: How A Third Party Can Remove Your Site From Google SERPs」という記事タイトルで、彼が実際に経験したウェブサイト乗っ取られ事件について、詳細を公表しました。

非常に長いポストですが、興味のある方はぜひ原文を読んでほしいと思います。

ここでは、要点をかいつまんで説明します。

そもそも「Proxy(プロキシ)とは?」という疑問が沸く人もいるでしょう。

Proxyとは、「代理」という意味があり、インターネットではProxy Server(プロキシサーバー)として利用されている仕組みです。

Proxy Serverは、ウェブサーバーに格納されているウェブサイトのコンテンツ(ウェブページ本体のHTMLファイルや、JPG、GIFなどの画像ファイル、MP3やFlashなどのマルチメディアファイル)を、自分のハードディスクに保存します(Cache、キャッシュという)。

プロキシサーバーが、なんのためにウェブページのコンテンツをキャッシュするかというと、理由はいくつかあるのですが、ひとつはセキュリティのため、もうひとつはより早くウェブページを閲覧できるようにするためです。

より詳しいことは、「プロキシとは」で調べてください。

通常は、

ブラウザ(あなたのPC) ⇒ 閲覧先のウェブサーバー

のようにアクセスされます。

これが、Proxyが介在すると

ブラウザ(あなたのPC) ⇒ Proxy (⇒ 閲覧先のウェブサーバー)

となります。

プロキシサーバーが、間に入るんですね。

ウェブサーバーが(カッコ)でくくられているのは、プロキシサーバーにアクセス先のウェブサーバーのコンテンツがキャッシュとして保存されている場合は、ウェブサーバーにアクセスしないからです。

プロキシサーバーは、自分が保存しているコンテンツのコピーを、ブラウザに提供します。

この「コピー」というのが曲者なのです。

Proxy Serverがもつウェブコンテンツをキャッシュする機能と、それを処理するGoogleのアルゴリズムのバグが原因となって、Website Hacking(ウェブサイトの乗っ取り)が発生する可能性があるのです。

では、具体的にどのような仕組みでProxy Hacking(プロキシハッキング)が、グーグルで起こるのでしょう?

続きは、明日。