Googleが対策に乗り出した“コンテンツファーム”とは

コンテンツスパム対策を強化するためにGoogleがアルゴリズムを改良したことを昨日のエントリで伝えました。

公式アナウンスのなかでMatt Cutts氏は次のように言っています。

As “pure webspam” has decreased over time, attention has shifted instead to “content farms,” which are sites with shallow or low-quality content.

「純粋なウェブスパム」は長い期間をかけて減少してきた。代わりに、「コンテンツファーム」に注意が移ってきた。コンテンツファームというのは、内容が浅かったり質が低くかったりするコンテンツのことだ。

ここで出てきた“Content Farm”(コンテンツファーム)とはいったいどんなものなのでしょう?
※日本語で発音すると「コンテント・ファーム」になりますが、日本語では複数形(Contents)で使うことがほとんどなので「コンテンツ」を使います。

Matt Cutts氏は「内容が浅かったり質が低くかったりするコンテンツ」と表現していますが、「コンテンツファーム」に明確な定義が存在するわけでもなく誰がいつどこで使い始めたのかも定かではなさそうです。

WebmasterWorldでも何がコンテンツファームに該当するのかが議論になっています。

たとえば次のようなコンテンツがコンテンツファームに相当しそうです。

  • スクレイピング
    他のサイトからコンテンツをコピーしてページを自動生成したコンテンツ
  • 自動生成したコンテンツ
    完全に自動化されたものもあるし、多少人の手が加えられたものもあります。
  • 信ぴょう性が担保されていない投稿サイト
    一般人のユーザー同士が助けあうQ&Aサイトは、素人が回答する場合も多いです。
  • 既存のコンテンツを書き直したコンテンツ
    単語を変えたり語順を入れ替えたり、でも言ってることは同じ。
  • 宣伝のためのコンテンツ
    見返りに報酬をもらうために書く、商品やサービスのレビュー記事。
  • ウィキ
    百科事典タイプのコンテンツ

他にもコンテンツファームに該当しそうな例が出ていますが、とりあえず分かりやすいものを挙げました。

基本的には、内容に乏しい(=役に立たない)コンテンツを大量に作り上げるのがコンテンツファームと言えそうです。

上に挙げたなかで、スクレイピングやツールで完全自動作成したコンテンツは無価値で無差別なコンテンツなのでコンテンツファームに当てはまるでしょう。

人の手で作ったとは言え、単に書き直しただけの記事(俗にいう「リライト」)も質の低いコンテンツと言えます。
見た目は違ったとしても中身が同じなら、結局はコピーコンテンツです。
検索結果の1位〜10位に並んだページが、微妙に言い回しは違うけどどれも似たような文章で言ってることは何も違わないとしたら、あなたはどう感じますか?

上に挙げたなかで、ユーザーの役に立つ場合もあれば立たない場合もある両方が含まれる例もあります。

Q&Aサイトがそれです。
回答してくれた人によっては非常に役に立つ場合もあります。
しかし、素人判断でいい加減な回答をする人もいます(本人に悪意があるわけではないと思いますが)。
教えてgoo!やYahoo!知恵袋を見て「いや、それは違うでしょ」という答えを見かけたことはありませんか?
こういう信ぴょう性に乏しいコンテンツが大量に発生すれば、それはコンテンツファームに該当するかもしれません。

信ぴょう性が疑わしいという点ではウィキタイプのサイトも同じです。
世界最大の百科事典サイトのWikipediaですら、すべてが真実の情報とは限りません。
世の中には無数のウィキスタイルのサイトが存在します。
使いものにならないウィキも多そうです。

「自動生成したコンテンツは役に立たない」と言いましたが、これは100%そうとは言い切れません。

たとえば僕が1日に数回チェックする「晴練雨読」というサイトがあります。
晴練雨読さんのSEO記事リミックスはSEO関連の記事を集約したコンテンツです。
他のサイトの更新情報をRSSで引っ張ってきているのでオリジナルのコンテンツはほとんどありません。
でも見やすいし、質のよい記事が集まっているのでものすごく重宝しています(たまに変なのも混ざってますがw)。

同じようにSEO記事をRSSで引っ張ってくるサイトが他にもありますが、どうみてもページを増やすだけのただの“垂れ流し配信”にしか思えないサイトが大半です。

人の手で作ったけれど、内容が薄くて信ぴょう性に欠けるというコンテンツファームの代表例としてやり玉に挙がっている「Demand Media」が運用するサイトがあります。

アルゴリズムによって人が注目しているニュースを判断し、それについて記事を書いて配信するサイトです。
ただその記事を書くのは専門家でもなんでもない在宅ワーカーだったりして、取材や事実関係の裏付けもない薄い内容のコンテンツを次から次へと大量に公開しています。
このサイトのページがGoogleで上位表示することが多く、不満を買っているのです。
今回のGoogleのアルゴリズム変更はDemand Media対策だという推測があるくらいです。

このように考えると、Googleが、コンテンツファームかどうかを判断するために「質の低さ」を見極める基準・能力が信頼できるものかどうかは僕たちサイト管理者にとってとても重要なことになります。

大量生産された無価値なサイトが消えることは“健全な”SEOを施策しているサイト管理者にとっても一般ユーザーにとっても好ましいことです。
しかし実際にはコンテンツファームではないのに、検索結果から消えていくサイトが生まれるかもしれません。
WebmasterWorldのスレッドを読むと実際にそういうサイトが出てきているようです。
本当はインフルエンザではないのに検査したら「陽性反応」が出てしまって隔離されたようなものですね。

Googleがどんなサイトを「コンテンツファーム」としてみなすのか、今後情報が出てくるのを待ちましょう。