Webサイトの集客改善について、”無料”で相談してみませんか?
貴社に最適なテクニカルSEO対策・コンテンツSEO対策・リスティング広告運用を無料でアドバイスいたします!
▶無料のSEO相談窓口はこちらから
クローラーとは?意味や仕組み、クローラビリティを高めるポイントを解説
当記事では、クローラーの概要や仕組み、クローラーに巡回してもらいやすくするためのポイントなどを紹介します。
Webサイトを運営しているものの、なかなか検索結果に表示されない、検索順位が低いといった方は、当記事の情報が参考になる可能性がありますので、ぜひご覧ください。
また、Keywordmapを開発したCINCでは、ビッグデータを活用し、SEO戦略の策定から効果検証まで一気通貫で支援しています。SEOに詳しい人がいない、SEOの成果が出ないとお困りの方はお気軽にご相談ください。⇒CINCのSEOコンサルティング・SEO対策代行サービス
目次
クローラーとは?
クローラーとは、Webサイトを巡回して収集し、データベース化するロボットのことです。クローラーという名前は「這い回る」という意味を持つ英単語の「crawl」に由来するとされています。
クローラーは、インターネット上に張り巡らされているリンクをたどることでWebサイトを定期的に巡回しており、コンテンツの内容や画像などの情報を収集し、データベースに最新の情報を登録することで、常に検索結果に適切なコンテンツを表示できるようにしています。
一方で、クローラーが巡回していないWebサイトは検索エンジンの検索結果に表示されることはありません。いくらユーザーにとって魅力的なコンテンツを作ったとしても、検索結果に表示されないのでは意味がないでしょう。そのため、SEO対策を行ううえでクローラーに巡回してもらうという点は非常に重要だといえます。
ちなみにクローラーと一言でいっても、その種類はさまざまであり、検索エンジンによって異なります。例えば、日本だとGoogleで情報を検索する人が多いかと思いますが、GoogleではGooglebotというクローラーを使用しています。
また、BingではBingbotを使用し、中国のBaiduではBaiduspiderというクローラーが使われています。
Googleは、世界でのシェアがトップの検索エンジンであり、日本でも非常に高いシェアを誇ります。そのため、一般的にはクローラーというとGooglebotのことを指すケースが多くなっています。
クローラーの対象ファイル
クローラーがWebサイトを巡回する際、以下のようなファイルをチェックします。
- HTML
- CSS
- JavaScript
- 画像(GIF/JPEG/PNG/WebP/SVG)
- 動画(MP4/WebMなど)
- オフィス文書(Word/Excel/PowerPoint)
「クローラーが収集する情報はHTMLだけ」と考えている人もいるかもしれませんが、上記の通りさまざまなファイルをチェックし、データベースに登録しています。これは、Webサイトはキーワードによる検索だけでなく、画像や動画、文書、PDFも検索結果に表示されるためです。
CSSとJavaScriptに関しては、検索結果に出てくるものではありませんが、Googleではコンテンツを評価する際の指標の1つとしているため、これらの情報も対象となります。
クローラーの種類
繰り返しの説明となりますが、クローラーは検索エンジンによって異なるため、さまざまな種類が存在します。以下は、主なクローラーの種類です。
- Google:Googlebot
- Google:Googlebot-Image(画像用ボット)
- Bing:Bingbot
- YANDEX:YandexBot
- Baidu:Baiduspider
- Mail.ru:Mail.RU_Bot
日本の場合、Yahoo!JAPANを検索エンジンとして使用する人もいるかもしれませんが、Yahoo!のクローラーはありません。これは、Yahoo!ではGoogleの検索エンジンを取り入れており、それに伴いクローラーもGooglebotを使用することとなっているためです。
クローラーの仕組み
クローラーの仕組みは簡単にいうと、クローラーがリンクをたどることでさまざまなWebページを巡回し、情報を収集したうえでインデックスを行い、その情報に基づいてページがランク付けされ検索順位が決まります。
詳しく説明すると、クローラーはまずクロールと呼ばれる作業を行います。これは、クローラーが各Webページを訪れどのような内容なのかチェックすることです。また、クロールの際は1つのページを確認するだけでなく、リンク先のコンテンツにも移動し情報収集を行います。
収集された情報はGoogleに保存されます。この情報が保存されることがインデックスです。インデックスされた情報は、検索結果の順位を決める際の判断材料となります。情報を踏まえたうえで各ページがランク付けされ、具体的な検索順位が決まります。
検索エンジンの仕組みをもっと知りたい方は、こちらの記事をチェックしてみてください。
「検索エンジンの仕組みを解説!その他検索機能や重要アルゴリズムも紹介」
SEO対策におけるクローラーの重要性
SEO対策に取り組むうえでは、クローラーの重要性を理解しておくことが大切です。先ほども説明したように、検索結果の表示順位はクローラーがWebサイトを巡回して集めた情報をもとにGoogleがランク付けを行って決められます。そのため、そもそもクローラーが巡回に来ていなければランク付けの対象にすらなりません。
詳しくは後述しますが、クローラーに自社サイトを巡回してもらい、情報をしっかりと収集してもらうためには、押さえるべきさまざまなポイントがあります。コンテンツ制作、Webサイト運用にあたってはそれらの点を意識することが大切です。
また、Googleではユーザーファースト、つまりユーザーにとって役立つ情報であるかを重視しているため、ユーザーのニーズを把握し、疑問や不安を解消できるような内容にすることも必要不可欠です。そのほかにも、クローラーは複数回に渡ってWebサイトを巡回することから、常に新しい情報を発信していることを伝えるために定期的な情報更新も忘れてはいけません。
クローラビリティを向上させるポイント
クローラビリティとは、簡単にいうとクローラーにWebサイトを巡回させやすくすることです。Webサイトを立ち上げたからといって、すぐにクローラーが巡回に来るわけではありません。
クローラーが巡回しやすいサイトにしておかないと、なかなかクローラーにWebサイトを見つけてもらえず、いつまでたっても検索結果に反映されない状態となってしまいます。このような状態を回避するためにも、クローラビリティを高め、早い段階でクローラーに巡回してもらうことが大切です。
クローラビリティを高め、クローラーに見つけてもらいやすくするためには、さまざまなポイントがあります。ここでは以下8つのポイントを紹介します。
クロールのリクエストを行う
クローラーにWebサイトを見つけてもらうためには、Googleに対して「Webサイトを巡回して欲しい」というリクエストを送ることが重要です。これは GoogleのSearch Console(サーチコンソール)と呼ばれるツールを利用することでできます。 サーチコンソールはGoogleが提供する無料サービスとなっているため、誰でも利用可能です。
なお、リクエストを送る際はタイミングがカギとなります。例えば、新しいコンテンツを公開したタイミングやコンテンツの情報を更新したタイミングなど、Webサイトで何かしらの変化やアクションが起こった直後にリクエストを送ることをおすすめします。
以下はGoogleにインデックス登録を促す方法です。こちらを行うことでインデックスされるためのクロールを促すことができます。
URLの構造・階層の見直し
WebサイトのURL構造や階層を見直し、シンプルにすることもクローラービリティ向上のポイントとなります。URLが長くて階層も複雑なものになっていると、クローラーはなかなかWebサイトを見つけることができません。したがってGoogleも、以下の通りシンプルなURLを推奨しています。
サイトのURL構造はできる限りシンプルにします。論理的かつ人間が理解できる方法でURLを構成できるよう、コンテンツを分類します。可能であれば、長いID番号ではなく意味のある語句をURLに使用します。
(引用:https://developers.google.com/search/docs/crawling-indexing/url-structure?hl=ja)
また、URLにコンテンツに関連するキーワードを含めることも大切です。キーワードが含まれたURLによって、クローラーがWebページの内容を理解しやすくなります。
ただし、クローラーのためだけでなく、ユーザーがページの内容しやすいURLにすることが重要です。実際にGoogleのジョン・ミュラー氏は、TwitterでURLにキーワードを含めることで、軽微ではあるものの、SEO効果があること、ユーザーのために機能するURLにすることが重要である点に言及しています。
コンテンツがインデックスに登録されると、URL内のキーワードのSEO効果は最小限になります。SEOのためではなく、ユーザーのために機能するURLを作成します。また、既存のサイトのURLを変更するのはサイトの移行であり、再処理に時間や変動がかかるため、重要でない限り避けたいと思います。
(引用:https://twitter.com/JohnMu/status/1296006310488662016?s=20)
シンプルかつキーワードを含めたURLになっているか改めて自サイトのURLをチェックしてみてください。
XMLサイトマップの作成
XMLサイトマップとは、Webサイトの構造やコンテンツなどの情報を検索エンジンに伝えるためのガイド・地図のようなものです。Webサイト全体の構造をまとめており、クローラーがWebサイトを理解しようとする際の助けとなることから、クローラービリティの向上につながります。
例えば、以下のようなWebサイトの場合、クローラーがWebサイトの内容を理解しにくい状態となっており、Googleによる評価・ランク付けが難しくなっている可能性があるため、XMLマップの作成をおすすめします。
主な、XMLサイトマップの作成方法は以下2つです。
①「sitemap.xml Editor」ツールを使う
sitemap.xml Editorとは、XMLマップを自動で作成してくれるツールのことです。sitemap.xml Editorサイトにアクセスし、対象となるWebサイトのURLを入力するとワンクリックでXMLサイトマップを作ってくれます。マップの取得が可能なURLは最大で1,000までとなっていますが、マップの作成自体は無料できるため誰でも利用可能です。
②「Google XML Sitemaps」プラグインを導入する
Google XML Sitemapsとは、WordPressを使ってWebサイトを運用している際に利用できる拡張機能のことです。こちらもXMLサイトマップを自動で作成してくれます。
内部リンクの最適化
クローラービリティを高めるうえでは、内部リンクの最適化は欠かせません。内部リンクとは、Webサイト内で関連しているページ同士を連携させるリンクのことです。
クローラーは、Webサイト内のリンクを経由してサイト内を巡回するため、内部リンクが適切に整備されていると、効率よく巡回することができます。一方で内部リンクがない、リンク先が間違っているといった状態だと、情報収集に時間がかかってしまうため、結果的に検索エンジンになかなか表示されないといった事態になる恐れがあります。
また、内部リンクの数が少ないコンテンツは重要度が低いコンテンツと判断されることもあります。そのように判断されるとクローラーによる巡回頻度も少なくなるため、検索順位に悪影響を及ぼす可能性があるでしょう。このような点からも、内部リンクの設定は必要不可欠だといえます。
なお、内部リンクはただリンクを設定すればいいというものではありません。コンテンツ同士に何の関連性もないようなリンクは評価を下がる恐れがあります。Googleはユーザーにとって利用しやすいWebサイトであるかを重視しているため、そのような観点からも関連性のない内部リンクの設定は望ましくないでしょう。
リンクが切れているページの排除
Webサイト内でコンテンツを削除した場合、そのコンテンツにむけた内部リンクは削除してください。これは、誤った内部リンクや削除されているコンテンツの内部リンクが残ったままだと、クローラーが適切に情報を収集できず、Webサイトの評価が低下する恐れがあるためです。
なお、リンク切れページの削除は発リンク(外部サイトへのリンク)を設定している場合も同じです。発リンクの場合、コンテンツが削除されているかどうか把握できていないケースもあるため、こまめにチェックしましょう。
パンくずリストの設定
パンくずリストは、ユーザーが閲覧中のページがWebサイト全体の中でどこにあるものなのか、階層を示したものです。パンくずリストという名前は、童話ヘンゼルとグレーテルの中で道に迷わないようにヘンゼルがパンくずを道に落としたことに由来するとされています。パンくずリストは、Webサイトの中で以下のような形で掲載されています。
パンくずリストを設定することで、クローラーがWebサイトの構造を理解しやすくなり、クローリングもやりやすくなります。また、パンくずリストはユーザーにとってもWebサイトをわかりやすくしてくれるため、Googleの求めるユーザーファーストにも合致します。クローラービリティを高めるためにも、ユーザーの利便性を高めるためにもパンくずリストを設定しておきましょう。
クロールの制御
検索エンジンから評価される必要のないページへのクロールを制御することで、優先的に評価されたいページへクロールを誘導することができます。
検索エンジンから評価されたいページ群へクロールが集中することで、そのページ群のインデックスが早まったり、ページの更新や改善が早く伝わるようになるため、SEOに良い影響があると考えられます。
サーバーの最適化
Webサイトに使用しているサーバーを最適化することでもクローラービリティの向上につながります。サーバーの最適化を図るためには、以下のようなことに取り組んでみてください。
- ストレージ/メモリの容量増加
- CPUの性能を高める
- コーディングで使用している言語のバージョンアップ
- データベースの改善
上記のような取り組みはサーバーへの負担軽減につながります。サーバーのパフォーマンスが向上すれば、クローラーもWebサイト内を巡回しやすくなるため、結果的にクローラービリティも高まるでしょう。
クローラーが自社サイトに巡回しているか確認する方法
Webサイトを運用し始めたものの、なかなか検索結果に自サイトが表示されない場合、クローラーが自社ページを巡回していない可能性があります。
以下では、自サイトをクローラーが巡回しているのかを確認できる2つの方法を紹介します。
- 「site:ページURL」で検索する
- サーチコンソールの「クロールの統計情報」で確認
①「site:ページURL」で検索する
検索エンジンでsite:検索をすればすぐに自サイトがクローラーに巡回されたかどうかがわかります。
site:検索をする場合、検索エンジンの検索窓に自サイトのURLを記入してください。そしてURLの前に「site:」とつけて検索します。検索結果に自サイトが表示されていない場合は、クローラーが巡回していないという意味になります。
②:サーチコンソールの「URL検査」で確認
Googleのサーチコンソールを使って確認することもできます。サーチコンソールにログインして、検索窓に自社ページのURLを検索してください。
検索結果に「URLはGoogleに登録されています」と表示されればクローリングされていることとなります。
③:サーチコンソールの「クロールの統計情報」で確認
サーチコンソール画面の左サイドバーの「設定」をクリックし、「クロールの統計情報」>「レポートを開く」をクリックすると、自社サイトへのクロール状況を把握できます。
具体的には、以下グラフで示している「クロールリクエストの合計数」の推移を確認することで、クロールされている頻度やクロールされた回数を把握することができます。
まとめ:クローラーの仕組みを知ってSEOに役立てよう!
今回は、「クローラーとは?」というテーマで、その概要や仕組み、クローラビリティを高める方法について解説しました。
クローラーはリンクを辿ることで様々なWebページを巡回し、情報を収集します。
また、検索結果はクローラーがWebサイトを巡回して集めた情報をもとにランク付けが行われているため、SEOにおいてクローラーは非常に重要です。クローラーに巡回されないと、そもそも検索結果には表示されないため、クローラーの巡回を促す施策(クローラビリティを高める)はぜひ押さえておきましょう。
クローラビリティを高めるには以下の方法を実践しましょう。
- クロールのリクエストを行う
- URLの構造・階層の見直し
- XMLサイトマップの作成
- 内部リンクの最適化
- リンクが切れているページの排除
- パンくずリストの設定
- サーバーの最適化
当記事を参考にクローラーについて理解を深めてみてください。
詳しくはこちら
Keywordmapのカスタマーレビュー
ツールは使いやすく、コンサルタントのサポートが手厚い
良いポイント
初心者でも確実な成果につながります。サポートも充実!
良いポイント
機能が豊富で、ユーザーニーズ調査から競合分析まで使える
良いポイント