Google が嫌うスパム行為の1つに、「ミラーコンテンツ」というものがあります。
ミラーコンテンツが何であり、何が問題なのかを理解し、ミラーコンテンツによる損失がないように注意しましょう。

  • 酷似したコンテンツが複数あるとスパムとされる
  • ユーザーに便利なミラーコンテンツも発生しうる
  • canonical 属性でミラーコンテンツ扱いを回避する

ミラーコンテンツとは?

ミラーコンテンツのイメージ
ミラーコンテンツとは、同じWebサイト内のコンテンツ、または別のWebサイトのコンテンツと、まったく同一か、非常に酷似したコンテンツのことを指す。「重複コンテンツ」や「コピーコンテンツ」ともいわれます。似たようなWebページを大量に生成してページ数を増やし、非常にボリュームが多いWebサイトであるかのように見せかけようとしたり、よそのWebサイトの良質なコンテンツをコピーし、自分のWebサイトに盛り込んでWebサイトの評価を上げようとしたりする、れっきとしたスパム行為です。

ですが、問題なのは、この行為は悪気がなくても順位が下がるというものです。

2個とも本物と言う場合に大変困ります。また、自分ところが本物なのに相手のサイトにパワーが合って、自社サイトの順位が下降する場合があります。

GoogleはこのようなWebサイトに対しては、評価を上げるどころかマイナスの評価しか与えませんし、最悪のケースでは、一方のWebサイトがペナルティを受けて、検索結果から削除されるということもあります。

Googleは検索するユーザーに対して、できるだけ幅広い情報を与えたいと考えています。そのため、同じような内容のコンテンツが書かれているWebページを検索結果の上位に表示させることはしません。たいていの場合、似たようなWebページのうちのどれか1つ、原則としては最初にそのコンテンツが書かれた「オリジナル」のWebページのみを評価します。

自然に起こり得るミラーコンテンツ

商品ごとに発生するミラーコンテンツ
先ほどお話ししたように、Webサイト内に似たようなコンテンツが存在するからといって、そうしたすべてのWebサイトのオーナーにスパム的な意図があるわけではないでしょう。まったく意図しないうちに、自然にミラーコンテンツが発生してしまうケースがあるというところが厄介です。どのようなケースかを紹介するために、靴を販売しているショッピングサイトを例に挙げてみます。

靴のショッピングサイトに訪れたユーザーは、そのWebサイト内で自分が求める条件に合った靴を探すことになりますが、条件に合ったものが見つからなければ、商品を買わずに離脱してしまうだろうことは容易に想像できます。ユーザーによって、足のサイズが違ったり、求める靴の色が違うのは当然です。そのため、Webサイトのオーナーは、幅広いユーザーのニーズに対応するために、同じメーカーの、同じデザインの靴であっても、サイズ別、色別に紹介ページを分けようと考える場合があります。

まさにここが落とし穴なのです。意図があってサイズ別、色別に分けたWebページとはいえ、サイズと色が違うだけの酷似したWebページとして大量に発生してしまうからです。Webサイトのオーナーにとっては、ただユーザーの利便性を高めるために作ったWebページに過ぎないため、ミラーコンテンツとして問題になるとは思いもしないでしょう。

しかし、このような状況に陥っているショッピングサイトは非常に多いです。この問題に気付き、「ユーザーのために作ったページがミラーコンテンツになってしまう」、「どうすればよいのか」などと、頭を抱えるオーナーも多いのです。

Webサイトを閲覧するユーザーに評価されるWebサイトが、検索エンジンにも評価されるWebサイトであると、これまでにも繰り返し解説してきました。しかし現状、前述した靴のショッピングサイトのようなケースでは、それがユーザーのためのコンテンツであると検索エンジンが判断することは難しいのです。

ミラーコンテンツを回避する「canonical 属性」

canonical属性の説明画像
そこで、こういったミラーコンテンツを回避するために、Googleは「canonical」という属性を使用することを推奨しています。canonical属性は、「URLが異なる、内容が同一または酷似したWebページが複数存在する場合に、その中で代表となるURLを指定することで、重複問題を防ぐ」という役割を持っています。

前述の靴のショッピングサイトを例にして、canonical属性の使いかたを解説します。たとえば、赤い靴のWebページ(http:www.sitename.com/red.html)と青い靴のWebページ(http:www.sitename.com/blue.html)の
酷似によりミラーコンテンツが発生したとします。この際、赤い靴のWebページを代表URLに指定すると仮定した場合、青い靴のWebページのソースコードの<head>タグ内に下記の記述を行います。

<link rel=”canonical” href=”http:www.sitename.com/red.html”>

この記述を行うことで、「青い靴のWebページは、赤い靴のWebページと同一の内容を掲載しています」と検索エンジンに伝えることができます。

これによって、検索エンジンは、赤い靴のWebページと青い靴のWebページをミラーコンテンツとは見なさなくなるのです。

ただしこの際、「青い靴のWebページ」は検索結果には表示されなくなるということを認識しておく必要があります。今回のケースではミラーコンテンツ対策として行っているため問題はないはずだが、ミラーコンテンツ対策以外の目的でcanonical属性を使用する際には注意が必要だということです。重要なWebページにcanonicalタグを設定してしまえば、そのWebページが検索結果に表示されなくなってしまうため、十分に注意しておきましょう。

ミラーコンテンツの確認

重複コンテンツ・ミラーサイト・類似ページ判定ツール sujiko.jp
このページでは2つのページが重複コンテンツなのか、類似ページなのかを比較/判断してくれます。

また、Googleでは検索したURLの最後に「&filter=0」と入れて再度検索すると、重複コンテンツが表示された検索結果が出てきます。
これらの方法でミラーサイトの有無を確認しましょう。

もしミラーサイトを見つけたら

ミラーサイトにもすべてが悪意のあるものではないとお話ししましたが、最近では個人情報などの盗用を目的に悪い業者が故意にミラーサイトを作成するケースも増えてきています。
もしそのようなサイトを発見した時にはGoogleに著作権侵害申請をする必要があります。

ミラーコンテンツ取り締まりの説明画像
ミラーサイトのような盗用コンテンツが自社サイトの著作権を侵害していることをGoogleに通知すれば、Googleがそのコンテンツを削除したり、コンテンツへのアクセスを無効化したり、もしくはコンテンツの登録ユーザーのアカウント停止といった対処をしてくれるようになりました。
削除リクエストについてのGoogleの説明

報告はこちらから

また、ミラーサイトから自社サイトへ外部リンクが貼られている場合は、Google search consoleから外部リンクの否認を設定することも可能です。

逆にミラーサイトを有効活用できるケース

何かしらの原因でWebサイトの同時アクセスが瞬間的に増えた場合、許容量を超えてサーバーがダウンし、Webサイトが見れなくなってしまった時に、ミラーサイトを設置していればコンテンツを閲覧できない状態を回避することができます。

県や市などの自治体のWebサイトは、緊急の災害時や選挙時期など、アクセスが集中しやすい時期に備えて公式Webサイトへのアクセスをミラーサイトに誘導させて負担を軽減させるための措置をとっています。総務省も有事に備える意味でのミラーサイト運用を推奨しています。

ただしその場合は先ほどお伝えした「canonical」属性や「noindex」(Googleの検索エンジンにインデックスされないようにするため、htmlコードに記述するmetaタグで記述しておけば検索結果には表示されない)を設定して上手に立ち回りましょう。