重複コンテンツとは?SEOへの影響やペナルティを防止するための基準も解説
そこで今回、重複コンテンツを作成しないためのポイント、重複コンテンツが存在する場合の対処法について解説します。また、勘違いしやすい重複コンテンツの定義についても改めてみていきます。
当記事を参考に、重複コンテンツについて理解を深めてみてください。
また、Keywordmapを開発したCINCでは、ビッグデータを活用し、SEO戦略の策定から効果検証まで一気通貫で支援しています。SEOに詳しい人がいない、SEOの成果が出ないとお困りの方はお気軽にご相談ください。⇒CINCのSEOコンサルティング・SEO対策代行サービス
重複コンテンツとは
重複コンテンツとは、Webページの内容が他のページと酷似しているコンテンツです。重複コンテンツが自社サイト、あるいは外部サイトに存在することで、SEOに悪影響を及ぼすことがあります。
重複コンテンツは大きく以下の2種類に分けられます。
- 自社サイト内で類似したコンテンツを作成してしまった場合(意図せず作成しているケースが多い)
- 他社サイトと酷似したコンテンツが自社サイト内に存在してしまっている場合
当記事では、この2種類の重複コンテンツについて解説します。
重複コンテンツの基準とは
具体的にどのようなWebページが重複コンテンツに該当するのでしょうか。Googleは重複コンテンツについて以下を公表しています。
一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、同じ言語の他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。
引用:https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=ja
先述のように、重複コンテンツは自社ページ内であれ、自社ページと他社ページの間であれ、異なるページ・URL同士が酷似したコンテンツを掲載してしまっている状態を指すことがわかります。
重複コンテンツが発生するケースは以下の2通りに大きく分かれます。
- 自社サイト内にある他のコンテンツと内容が酷似している場合
- 外部サイトに自社コンテンツと内容が酷似しているものがある場合
自社サイト内にある他のコンテンツと内容が酷似している場合
Webサイト運営を行う上で、自社サイト内に類似したコンテンツが複数ページにまたがって作成されるケースがあります。例えば、ECサイトにおいて、商品は同じであるものの、商品の「カラー」ごとに異なるURLを設けている場合などがこれに当てはまります。
その場合、「カラー」以外の製品情報はほぼ同一になるため、検索エンジンから重複コンテンツとみなされる可能性が高くなります。
他にも、Googleは以下のような目的で複数URLが用意された場合に重複コンテンツが生成されることがあると、見解を示しています。
引用:https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?visit_id=637791439198665297-3081455555&rd=1&hl=ja
- さまざまな種類のデバイスに対応するため
- 並べ替えまたはフィルタに関するパラメータやセッション ID などで動的 URL を有効にするため
- ブログの複数のカテゴリに同じ記事を配置したため、ブログシステムにより複数の URL が自動的に保存された
- www あり / www なし / http / https とプロトコル ポートの各バージョンで同じコンテンツを配信するようにサーバーが構成されている
このように、意図せず自社サイト内で重複コンテンツを作成していることがあります。ただし、自社サイト内で重複コンテンツが存在してもペナルティには該当しません。
※自社サイト内に複数URLにまたがって重複ページがある場合の対処法は後述します。
外部サイトに自社コンテンツと内容が酷似しているものがある場合
自社サイトと他社サイトの間で重複コンテンツが生まれる場合、以下の2パターンが考えられます。
- 既に存在する他社ページと酷似したコピーコンテンツを無断で作成してしまった
- 既に存在する自社ページと酷似した内容を、他社サイトが後から作成した
後者は無断でコンテンツを盗用されるケース以外にも、自社サイトのコンテンツを自社サイト以外のサイトに提供する「シンジケーション」を行った場合や、自社サイトのコンテンツがをニュースサイトやキュレーションサイトに転載された場合などが該当します。
実際にGoogleは、無断で複製されたコピーコンテンツを以下のように定義しています。
引用:https://developers.google.com/search/docs/essentials/spam-policies?visit_id=638193180785159885-2217932174&rd=1&hl=ja#scraped-content
- 他のサイトのコンテンツをコピーし、元のソースを引用することさえせず、独自のコンテンツや価値を加えずに転載しているサイト
- 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えたうえで転載しているサイト
- ユーザーに対してなんらかの形で独自のメリットを提供することなく、他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
- ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだり編集したりしているだけのサイト
対処法については、後の章で解説します。
重複コンテンツが及ぼすSEOへの影響
そもそも、なぜ重複コンテンツを避けるべきなのでしょうか。当然、他社サイトのコンテンツをコピーすることは著作権の侵害にあたる可能性があるため避けるべき、というのはわかりますが、SEO上ではどのような悪影響が考えられるのでしょうか。
本章では、自社サイト内に重複コンテンツが存在する場合のデメリットについて解説します。
検索結果に表示されなくなる
重複コンテンツと判断されると、検索エンジンの検索結果に表示されなくなる可能性があります。実際にGoogleは公式に以下の見解を示しています。
Google は、こうした URL のうちの 1 つを「正規」版として選択してクロールします。その他の URL はすべて「重複」した URL と見なし、クロールの頻度を減らします。
(引用:https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=ja)
つまり、重複したコンテンツが複数存在する場合、そのうちの1ページのみを評価対象とし、それ以外の重複ページにはあまりクロールしなくなるということです。
かりにクロールの回数が極端に減って、ページの内容を認識されなくなれば検索結果に表示されなくなるでしょう。
なお、サイト内に重複ページが存在する場合は、そのいずれかを正規コンテンツとし、検索エンジンから正しく評価してもらう対象として扱ってもらうために、「URLの正規化」を行う必要があります。その方法については後述します。
被リンク評価が分散される
GoogleがWebページを評価する要素の一つに「被リンク」があります。被リンクとは、外部サイトから自社サイトのURLが貼られることを指し、その質・数によってコンテンツが評価されます。
実際にGooogは被リンク数を投票数ととらえ、多く投票が集まっているページを高評価する傾向があることを公表※しています。当然、高評価はSEOに好影響を及ぼし、検索上位の獲得に結びつきます。(※Google が掲げる 10 の事実:4. ウェブ上の民主主義は機能する。」
本来一つのページに被リンクが集められるはずだったにも関わらず、類似したページが複数存在することで、被リンクが各重複ページに分散され、評価が集めにくくなります。
後述しますが、重複したコンテンツの中で、検索エンジンに評価してもらいたいページを指定(URL正規化)することで、指定のページのみ検索結果に表示させることができ、被リンクが分散しないようにすることが可能です。
<重複コンテンツによって被リンクが分散されている場合>
<被リンクを1つのページ(正規ページ)に集約できている場合>
ペナルティを受ける可能性がある
自社のドメイン内ではなく、他社サイトと酷似したコンテンツを作成してしまった場合、ペナルティを受ける可能性があります。(なお、自社内にいくら重複コンテンツがあってもペナルティを受けることはありません。)
Googleは手動ペナルティの対象となるコンテンツについて、以下のように言及してきます。
・自動生成されたコンテンツ
引用:手動による対策レポート
・内容の薄いアフィリエイト ページ
・他のソースからのコンテンツ(例: 無断複製されたコンテンツ、低品質のゲストブログ記事)
・誘導ページ
また、無断複製以外にも、自社サイトのコンテンツを自社サイト以外のサイトに配信したり、自社サイトのコンテンツをニュースサイトなどに転載されたりした場合においても、重複コンテンツと認識されることがあります。
さらに、他社サイトが自社サイトのコンテンツを後から作成した場合でも、自社サイトがペナルティを受ける可能性があります。
自社サイトと他社サイトが重複していないか確認する方法については、次の章で解説します。
ペナルティを受けてしまった場合の対処法については以下の記事で詳しく解説しています。
重複コンテンツをチェックする方法
重複コンテンツの概要やSEOへの影響を知っていても、重複コンテンツが発生しているかどうか確認する方法を知らない方は多いのではないでしょうか。
そこで本章では、自社ドメイン内、あるいは外部に重複コンテンツが存在していないか確認する方法を紹介します。
コンテンツの一部を検索する方法
最も手軽な方法は、コンテンツの一部をコピーし、検索してみることです。そうすることで、コピーコンテンツが生成されていれば、コピーした箇所と一致するWebページが検索結果に表示されることがあります。それらのページを精査し、コンテンツが酷似していないかチェックしましょう。
しかし、この方法は確実ではないため、コピペチェックツールを使用することをおすすめします。
コピペチェックツールについては、後述します。
Googleサーチコンソールを活用する方法
サーチコンソールを活用して、重複コンテンツについて以下をチェックすることができます。
- 自社サイトのページ同士で重複コンテンツがないか
- 他社サイトと類似したコンテンツの生成によって、ペナルティを受けていないか
自社サイトのページ同士で重複コンテンツがないかどうかについては、サーチコンソールを開き、左メニューの中から「インデックス作成」>「ページ」をクリックします。
すると、重複コンテンツが存在する場合は「ページがインデックスに登録されなかった理由」の項目の中に「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と記載されます。
記載された部分をクリックすると、重複コンテンツと判断されたページが表示されます。
また、他社サイトと類似したコンテンツの生成によって、ペナルティを受けていないか確認するためには、サーチコンソールにログインし、画面左のメニューの「手動による対策」から調査する必要があります。ペナルティを受けていない場合、「問題は検出されませんでした」と表示されます。
コピペチェックツール「chiyo-co」を活用する方法
コピペチェックツール「chiyo-co」は、作成したコンテンツが、他社サイトのコンテンツと重複していないか、自社サイトのコンテンツが他社サイトにコピーされていないか確認できるツールです。
作成したコンテンツをツールに貼り付けることで調査が可能です。
また、自社サイト内で重複したページがないかどうかについても、チェックできます。
検索コマンドを活用する方法
Googleは類似したコンテンツや同じサイトのページが検索結果に複数表示されないように「フィルタ」をかけています。そのフィルタを解除することで、実際にどれくらい類似したページが存在するのか確認することができます。
調査したいページのURL末尾に「&filter=0」を追加し、検索するとフィルタがかからない状態で、検索結果にWebページが表示されるので、類似したページがないかチェックしてみましょう。具体的には、以下のように検索窓に調査したページのURLに「&filter=0」を追加し、検索します。
すると、検索結果に類似したページが表示されます。以下図の場合、同じサイト内のページが4件ヒットしています。
重複コンテンツの対策方法
重複コンテンツのデメリットや確認方法について解説してきましたが、あらかじめ重複コンテンツが発生しないように対策しておくことが大切です。
そこで本章では、重複コンテンツの対策方法を7つ解説します。
- 301リダイレクトを設置
- canonical設定を行う
- noindex設定を行う
- alternateタグを設定する
- オリジナルコンテンツを作成する
- ページを削除する
- 外部のサイトへページ削除を依頼する
301リダイレクトを設置
リダイレクトとはユーザーや検索エンジンが、あるWebページに訪問した際に自動で別のページに転送される仕組みのことで、重複コンテンツ対策として用いられることがあります。
その中で「301リダイレクト」とは、永続的にページをリダイレクトされることを指し、す。元のページを削除し、コンテンツを別のページに移動するサイトリニューアルを行う場合などに用いられます。
この301リダイレクトを正しく用いることで、重複コンテンツによって分散されたSEO評価を一つのページに集約させることができます。
301リダイレクトの設置方法については以下の記事で詳しく解説しています。
canonicalの設定を行う
canonical設定とは、重複したコンテンツが存在する場合に、どのページが正規URL(検索エンジンに評価してもらいたいページ)であるかを指定することを指します。
先述したように、重複コンテンツがあることで被リンクとSEO評価が分散してしまう可能性があります。canonicalを設定を設定することで、被リンクの分散を防ぎ、SEO評価を一つのページに集約させることが可能です。
canonicalは以下のように、重複コンテンツの中で正規のURLとしたいページに「rel=”canonical”」を付与することで設定可能です。
<link rel=”canonical” href=”https://example.com/dresses/green-dresses” />
canonicalの設定方法について詳しく知りたい方は以下の記事もチェックしてみてください。
noindexの設定を行う
noindex設定とは、名前の通り、検索エンジンにWebページをインデックスされないようにすることです。
重複コンテンツの中でも検索エンジンから評価を受ける必要のない、正規ページ以外はnoindex設定することをおすすめします。これにより、検索エンジンからのSEO評価を正規ページのみに集約することができるようになります。
noindex設定の方法は以下の記事で詳しく解説しています。
alternateを設定する
同じコンテンツであっても、PCやスマートフォンなどデバイスによって、URLを分けているケースがありますが、これは重複コンテンツと判断される可能性があります。その場合、一方のページが代替のURLであることを検索エンジンに伝える必要があります。
そこで用いられるのが、「rel=”alternate”」です。alternateを付与することで、一方のURLがもう一方のURL(ページ)の代替であることを伝えられるため、重複コンテンツと判断されなくなります。
例えば、PC用のサイト、スマートフォン用のサイトURLが以下であるとします。
- PCサイトのURL:http://○○○.com
- スマホ(SP)サイトのURL:http://○○○.com/sp/
この場合、<head>内に以下のような「alternateタグ」を記述します。
▼alternateタグ
<link rel=”alternate” media=”only screen and (max-width: 640px)” href=”http://○○○.com/sp/” />
alternateタグの使い方について、詳しく知りたい方は、Googleの公式見解も併せてチェックしてみてください。
「別々のURLを使用する場合のその他のおすすめの方法」
オリジナルコンテンツを作成する
重複コンテンツを避けるためには、日頃から他社サイトと被らないオリジナリティのあるコンテンツを作成することを心掛けましょう。
また、他社サイトのコンテンツを転用、引用したい場合は、必ず出典元のリンクを記載することが必要です。
ページを削除する
重複コンテンツの中で、削除しても問題ないページは削除することをお勧めします。
検索エンジンからの評価は不要であるものの、ページは残しておきたい場合は先述した「noindex設定」を行いましょう。
外部のサイトへページ削除を依頼する
外部サイトに自社ページのコピーコンテンツを作成されてしまった場合は、自社サイトが重複コンテンツ扱いを受けてしまう可能性があるため、サイトの運営者にページの削除を依頼しましょう。
削除の依頼をしたにも関わらず対応してもらえない場合は、Googleに報告しましょう。著作権の侵害であると判断されれば、該当ページがインデックスから削除されます。
以下のページからGoogleに報告することができます。
「著作権侵害の報告: ウェブ検索」
異なるトップレベルドメインを使う
日本だけでなく、海外向けに情報発信をしているメディアにおいては異なるトップレベルドメインを使うことで重複コンテンツを避けられる可能性があります。
例えば、日本向けのメディアは「.jp」、イギリス向けのメディアは「.uk」に設定します。Google側は異なる国の人に向けた情報発信だと認識することができるので、重複コンテンツとして認識されにくくなります。
類似コンテンツを統一する
重複コンテンツと認識されているコンテンツ同士をまとめて一つのコンテンツを作成し、類似コンテンツを少なくしましょう。コンテンツ内容をまとめることで、情報量が増え読者の満足度を上昇させることもできます。
またコンテンツを統一させる際には、リダイレクトの設定やページの削除を忘れないようにしてください。
URL削除ツールを使う
ページを削除したつもりになっていてもまだページが表示される場合があります。その場合、URL削除ツールを活用しましょう。
Google Search ConsoleのURL削除ツールを使えば検索結果からURLを削除することができます。ただし、削除期間は6ヵ月という一時的なものになります。
そのため、すぐに消したい場合はURL削除ツールを活用し、完全に削除したい場合はページファイルを削除して、404エラーを返すようにしたりnoindexの設定を行いましょう。
まとめ
「重複コンテンツとは何なのか」といった基礎知識から、重複コンテンツの確認方法、対策方法といった実践ノウハウまで網羅的に解説してきました。
重複コンテンツが存在することで、以下のデメリットがあります。
- Webページが検索結果に表示されない
- 被リンク評価が分散される
- ペナルティを受ける可能性がある
重複コンテンツを避けるために、以下の対策を実践しましょう。
- 301リダイレクトを設置
- canonicalの設定を行う
- noindexの設定を行う
- alternateを設定する
- オリジナルコンテンツを作成する
- ページを削除する
- 外部のサイトへページ削除を依頼する
当記事を参考に、重複コンテンツと判断されないサイト運営を行いましょう。
詳しくはこちら
Keywordmapのカスタマーレビュー
ツールは使いやすく、コンサルタントのサポートが手厚い
良いポイント
初心者でも確実な成果につながります。サポートも充実!
良いポイント
機能が豊富で、ユーザーニーズ調査から競合分析まで使える
良いポイント