WEBNOTE -

[IT]IT辞典

エクセル(Excel)などのアプリケーションソフトの便利な使い方・裏技やアクセス(Access)・MYSQLなどのデータベースから、VBAなどのプログラミング、MTなどのWeb(インターネット)関係、サーバー、ネットワーク、SEOなどネットビジネスその他用語などPC全般

重複するコンテンツ―問題と対策・対応・対処法(正規化)

ブラックハット SEO(ウェブスパム)

2012年4月25日付の[Google ウェブマスター向け公式ブログ]から届いたメールを読んでいて、気になる記事に目が止まりました。

今回 Google は、ウェブスパムをターゲットにした重要な変更を検索アルゴリズムに施しました。これまでも良質なサイトを適切に評価するために様々なアルゴリズムの変更を実施してきましたが、今回の変更では、Google の 品質に関するガイドライン に違反しているサイトについて、その掲載順位を下げるような対策を実施します。

 

そこで、念のため、自分のサイトが「品質に関するガイドライン」に違反している箇所がないかをチェックするため、同ガイドラインを再度読みなおしてみました。

 

 

品質に関するガイドライン

「品質に関するガイドライン」は、「基本方針」と「具体的なガイドライン」に大別されています。

たとえば、「基本方針」では、サイトの順位や PageRank を上げることを目的としたリンク プログラムに参加しない。特にウェブ スパマーや不正なウェブサイトへのリンクは行わないでください。など、ごく常識的なレベルの違反行為が挙げられています。

 

重複コンテンツの禁止

ただ、あらためて気になったのは、「具体的なガイドライン」に記載されている次のルールです。

複数のページ、サブドメイン、ドメインで同じコンテンツを公開しない。

 

SEOの基本の一つとして、「(大量)ページ数」という考え方があります。

つまり、ページ数が多ければ、多いほど、アクセスが増えるということです。

たとえば、100万PV(ページビュー)を集めようとした場合、全サイトのページ数が1ページしかなければ、有名人(ブランドのある人)でもない限り、おそらくは不可能でしょう。

何しろ、1ページだけで100万PVを稼がなければならないわけですから。

 

しかし、これはあくまで理屈の上での話ですが、仮に100万ページを作成することができれば、100万PVの達成はごく簡単なことになります。

100万ページあれば、1ページあたりのノルマはたったの1アクセスですむわけですから。

コンテンツの内容が良質で、しかも、キーワード対策などSEOの基本もおさえていれば、100万PVどころか、1000万、1億PV、あるいはそれ以上のPVもたやすいことでしょう。

ただし、現実問題として、100万ページ作成するのは大変なことなので、コツコツと地道にコンテンツを作成していくしかないわけですが…

 

具体例―ミラーサイト(ミラーリングサイト)

ところが、コンテンツの内容さえ問わなければ、ページ数を増やすこと自体は簡単なことです。

そのためには、さまざまな方法があります。

たとえば、大量のドメインを取得してサイトを複製し続ければ、100万ページ達成も夢ではありません。

しかし、こうした手法は、インターネットの世界に意味もない(ユーザーの役に立たない)ページをただ増やすだけのことで、結果的には利便性の低下をもたらし、ネットの価値、したがって、また「検索」の価値を貶めることとなります。

そのために、Googleはこの種の行為を禁止するわけです。

 

ちなみに、「同じコンテンツ」の複製は、自らの意思に反しても行われる場合があります。

つまり、手間を掛けずにただページ数を増やしたいと考えている者が、自分のサイトを丸ごとコピーして公開する場合があるからです。

本人の知らないところで、勝手にミラーサイト(ミラーリングサイト)が作られているわけで、こうした場合も、最終的には本人の責任となります。

 

 

重複コンテンツも必要な場合がある

複数カテゴリーとタグ

しかし、重複コンテンツも必要な場合があります。

たとえば、ネットショップなどで、同一商品のページを複数のカテゴリーに登録したいという場合などです。

 

こうした場合、ブログツールでホームページ・サイトを構築していれば、カテゴリーとは別に、タグという装置を使うことで、同一ページを違った観点から分類することが可能です。

しかし、これはあくまで個人的な感想なのですが、ホームページの世界ではカテゴリーとタグとの明確な使い分けは困難で、タグを導入すると、かえってサイト構成が混乱するのではないかという感じがします。

実際、タグを使用しているサイトもよく見かけますが、特にタグクラウドなど視覚的にわかりやすいようでいてサイト構成がわかりづらい気がして、私はあまり利用していません。

タスク管理ソフト(ToDo管理ソフト)やEvernoteなら「タグ」の存在意義はわかるのですが、ブログ(ホームページ)では、タグを使って横断的にページをまとめあげるのなら、新たにカテゴリーを設け、複数カテゴリーに登録したほうがサイト構成がわかりやすくなるのではないか、と考えています。

もちろん、カテゴリーとタグの明確な使い分けの基準があれば、問題はありません。

 

つまり、いたずらにページ数を増やしたいという目的からではなく、ユーザーの利便性に資するために、同じ内容のページを作成することが必要となる場合もあるということです。

実際、Googleもこうした「悪意のない重複コンテンツ」の存在を認めてくれています。

一般に、重複コンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのまとまりを指します。多くの場合、偽装を意図したものではありません。

 

 

正規化

どうやらGoogleの検索アルゴリズムには、「悪意」があるかないかを見極めるためのものが組み込まれているようで、サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の理由にはなりません。と述べています。

とはいうものの、Googleの検索アルゴリズムを絶対的に信用して、重複コンテンツを作り続けることにはやはり少し抵抗があります。

そこで、Googleは「正規化」と呼ばれる方法を提供してくれています。

正規化とは、ほとんど同じコンテンツの複数のページがサイトに含まれる場合、優先する URL を Google に指定する方法をいいます。

これには複数の方法がありますが、その一つに重複する「ページの URL のすべてのバージョンに canonical リンクを指定する」というものがあります。

この方法であれば、サーバーの設定を変更することなどなく簡単にMT(movable type)に実装することができます。

 



プリバシーポリシーサイトマップ