スクレイピングサイト(コピーサイト)の発見にGoogleが助けを求める

[レベル:全員]

スクレイピングによる問題を発生させている事例についてGoogleにレポートを送信してほしいと、Googleのスパムチームの長であるMatt Cutts(マット・カッツ)氏がツイートで協力を求めました。

マット・カッツのスクレイピング問題援助へのツイート

スクレイパーがあなた(のサイトの順位)を下げているとしたら、見つけたブログスクレイパーを僕たちに教えてほしい。goo.gl/S2hIh テストのための実データを必要としているんだ。

リンク先にアクセスするとスクレイパーをレポートするフォームに着地します。

Report scraper pages

このフォームから、問題を発生させているスクレイピングサイトをGoogleに通報できます。
特に求めているのはブログのスクレイパーとのことです。

“Scrape”(スクレイプ)というのは、聞き慣れた日本語で表現するなら“コピー”のことです。

“Scraping Sites”(スクレイピング・サイト)や“Scraper Sites”(スクレイパー・サイト)と言えば、他人のコンテンツを無許可でコピーして掲載しているサイトのことを指します。

無関係の人に黙って自分の記事をコピペされてしまった経験は多くの人が経験しているはずです。
RSSで記事を自動取得して更新を続けているサイトが山のようにありますね。

問題となるのは、オリジナルである自分のサイト(ページ)よりも不正にスクレイピングした他人のサイト(ページ)が上位に表示されてしまうことです。

Googelは長年、スクレイピングがオリジナルよりも上に来てしまう問題に悩まされて来ました。

類似したコンテンツを嫌うパンダ・アップデートでもこの現象が発生していて、オリジナルが重複コンテンツだと誤検知されてランキングがダウンし、コピーしたスクレイピングサイトがとどまっているというまったく納得のいかない検索結果になっているケースが多数発生していたようです。

パンダ・アップデート v2.2ではスクレイピング問題に対応したと説明していましたが、決して十分ではなかったようです。

ウェブスパムや有料リンクのようにユーザーからのレポートを素にしてスクレイピング問題を改善していこうという試みでしょう。

スクレイピングのレポートページは英語で書かれています。

日本語のサイトで発生しているスクレイピングを通報してもいいのか、GoogleのJohm Mueller(ジョン・ミューラー)氏に尋ねました。

次のような回答をもらっています。

Please report all of them where you see a problem. I don’t know if this is something that’s rolling out in English first, but at least the team would have your input already if you have reported it. It would help to add a note saying that the sites are in Japanese in the comments to your submission. Thanks!

問題を見つけたページは全部レポートしてほしい。英語のサイトだけで最初は導入されているのか分からないけれど、もうレポートしたのなら該当チームはその情報をインプットしているだろう。レポート送信する時のコメント欄にそのサイトが日本語であることを書いてもらえると手助けになるだろう。

ということで、日本語のサイトであってもスクレイパーを発見したらGoogleに報告しましょう。

スクレイピングは有料リンクとは違って必要悪でもなんでもありません。
著作権の侵害にだってなりえます。

Googleのアルゴリズムが精錬されることは、ユーザーにとってはもちろん僕たちSEOに取り組むサイト管理者にとっても有益なことです。

Googleの通常の方針から判断して、通報したからといって手動でスクレイピングサイトの順位を下げることはしないはずです。
ですが、ユーザーから送られたデータを集めて分析し、問題を解決するためのアルゴリズムの改良を進めるでしょう。

英語が苦手な人のために、スクレイパーのレポートフォームの入力項目を日本語で説明しておきます。

4つのテキストボックスがあり上から順に次の情報を入力してください。

・1つめ
スクレイパーがオリジナルよりも上位に表示されているような、スクレイピングの問題を表示しているクエリを正確に入力します。問題が起こる検索に使ったキーワードのことです。必須項目です。

・2つめ
オリジナルのコンテンツのページのURLを入力します。コピペサイトに追い越されてしまっているあなたのサイトのページのURLです。必須項目です。

・3つめ
スクレイパーのページのURLを入力します。コピペしているページのURLです。必須項目です。

・4つめ
備考欄です。追加のコメントがあれば書きます。任意ですが、日本語のサイトであれば以下を追記しておきましょう。
“This scraping problem is occurring to sites in Japanese.”