コンテンツ盗用は防げるのか

『RSS配信による複製コンテンツを防ぐ方法』という記事を書いたところ、ブログ読者のユウさんからコメントをいただきました。

数ヶ月かけて作った、私のサイトもサックリとコピーされました。
どうしたものかと悩んでいるのですが、適度にリライト(語尾や言い回しを変えた程度ですが)されている為に、著作権云々も言い難い状態です。
明らかに、コピーなのですが・・・。

しかも私のサイトより上位に、同一人物に複数のサイトを突っ込まれています。(苦笑

コンテンツを盗まれたばかりか、オリジナルである自分のページよりも盗んだほうが上位表示されているというのです。
実際にこういったことが、発生しているのです。

複製コンテンツの問題については、Google Webmaster Cenral Blogでも取り上げられています。

この記事の最後に、次のように書かれています。

To conclude, I’d like to point out that in the majority of cases, having duplicate content does not have negative effects on your site’s presence in the Google index. It simply gets filtered out.

“結論として、大抵の場合において、複製コンテンツは、グーグルのインデックスではサイトの順位表示にマイナスの影響を与えないと言えるだろう。(複製コンテンツ)を実によく除外してくれる。”

間違ってはいないと思います。
実際に僕の記事もあちこちで引用タグなしに、コピーされてますが、オリジナルが検索結果から消えているのはなさそうだし、順位が下がっているのもなさそうです。
(気付いていないだけかもしれませんが)

しかし、ユウさんのような事例があることも、また事実なのです。

WebmasterWorldでも、同様のディスカッションが発生しています。

フォーラムアドミニストレータのtedster氏は、コンテンツを盗んだ方に負けてしまう原因として、次の3つが考えら得るとコメントしています。

  1. 気付かずに、コンテンツの一部へのGooglebot(グーグルのクローラ)のアクセスをブロックしてしまっている
  2. 盗まれた後に、コンテンツに変化を加えた
  3. オリジナルの記事(サイト)が、ウェブマスターのガイドラインに抵触している

思い当たる節はあるでしょうか?

2番目は、あまり語られることがなく、跡からコンテンツを修整すると、かえってオリジナルが派生コンテンツとして認識されてしまう可能性があるそうです。

ただ頭のいいコンテンツ盗作者は、内容をリライトしたりタイトルを変えたり巧妙に盗むので、対策は難しいですね。
(頭がよければ、自分で記事を書けるだろうに。(??;)

「コンテンツを盗まれて自分よりも上位表示された」とか「コンテンツ盗用をこのようにして防いだ」という体験があれば、コメントに残して情報を共有しましょう。

【追記】
重複コンテンツ問題については、SEMリサーチさんのこちらの記事が非常によくまとめられています。
Google、重複コンテンツ(コピペサイト)の対処方法について解説