インデックスとは?インデックスの仕組みと確認の仕方を解説
- 2022.05.03
- Googleアルゴリズム SEO対策 SEO技術
インデックスとはGoogleやYahoo!JAPANといった検索エンジンのデータベースにWEBページの情報が登録されることです。
各検索エンジンのインデックスに登録されることで、WEBサイトが検索結果に表示されるようになります。つまりインデックス登録されなければ、どれほど有用なWEBページであってもユーザーの目に触れるチャンスを得られず、SEOでの評価を受けることもありません。検索エンジンにインデックス登録されることは、WEBサイトにとって必須事項です。

インデックスとは
インデックスは英語のindexのことです。索引や見出しを意味します。インデックス登録とは検索エンジンがWEBページの情報を取得し、そのページの情報をデータベースに登録することです。インデックス登録が完了することで、WEBページの存在が検索エンジンに認識されるようになります。
ユーザーの画面に検索結果としてWEBページを表示させるために、インデックスされることは必須事項です。インデックス登録されていないWEBページは検索エンジンに把握されていないため、SEOの評価を受けることもできません。
インデックス登録されることは、WEBサイトを運営するうえで重要な意味を持ちます。SEOの観点では、WEBページを作成したら可能な限り早くインデックス登録されることが大切です。
インデックス登録される仕組み
検索エンジンがWEBページの情報を取得する方法は、クローラーと呼ばれる検索エンジンのロボットが巡回しながらWEBサイトの情報を取得することでおこなわれます。
検索エンジンのロボットであるクローラーの役割は、インターネットを巡回しながらWEBページにアクセスし、情報を収集することです。クローラーによって収集されたWEBページのデータは、キーワードごとに検索エンジンのデータベースに登録されます。これがインデックス登録の主な仕組みです。
クローラーとは
クローラーとはインターネットをクロール(crawlつまり巡回)するロボットです。GoogleやBingといった検索エンジンは、独自に開発したロボット型検索エンジンにインターネットをクロールさせることで、WEBサイトの情報を収集しています。なおYahoo!JAPANの検索エンジンは、Googleの検索エンジンシステムと同じです。
Googleの検索エンジンは日本国内だけでなく世界でもっとも広く利用されており、国内外共にシェア率は9割を超えます。そのため、SEOの観点ではGoogleのクローラーにアクセスされインデックスされることは必須事項です。
インデックス登録のほとんどは検索エンジンのロボットであるクローラーがWEBページにアクセスすることでおこなわれます。SEOの効果を高めるために、可能な限り早い段階でクローラがWEBページにアクセスするような対策を講じてください。
インデックスされるための方法
インターネットを巡回するクローラーは、WEBページのURLを利用してWEBコンテンツを検出して情報を収集します。クローラーにWEBページを検出させる方法はいくつかあり、積極的にクローラーにアクセスを促すことも可能です。
クローラーにWEBページを訪問させる方法には次のようなものがあります。
- WEBページにリンクを貼る
- XMLサイトマップを設置する
WEBページにリンクを貼る
早い段階でインデックス登録される必要がないWEBページであれば、クローラーが訪問するのを待つのも1つの方法です。
クローラーは、すでにデータベースに登録されているWEBページおよびそのページにリンクしているほかのWEBページをたどってインターネットを巡回しています。インデックス登録されるのを待つだけなので、特別な作業は不要です。
ただし、新しく作成されたWEBページやリンクが少ないコンテンツではロボットに発見されにくく、インデックス登録されるまでに時間がかかる可能性があります。
XMLサイトマップを設置する
XMLサイトマップとは、検索エンジンがWEBページの情報を取得しやすいようにまとめたファイルのことです。XML形式のファイルで作成されることからXMLサイトマップともよばれます。
新しく作成したWEBページやコンテンツ内容に変更があった場合にサイトマップによってURLを検索エンジンに通知することで、WEBサイトの存在や変更内容を速やかに検索エンジンに反映させる効果が期待できます。
Googleが対応するサイトマップには次のようなタイプがあります。
- XML
- RSS、mRSS、Atom 1.0
- テキスト
いずれかのタイプを選択して自動もしくは手動でサイトマップを作成したら、robots.txt ファイルに追加する、もしくはGoogleサーチコンソールに直接送信することでリクエストできます。
WordPressで作成しているWEBサイトであれば、プラグインでXMLサイトマップを作成することをご検討ください。プラグインを使用すれば容易にサイトマップを作成でき、更新作業をおこなった際も効率的な管理が可能です。プラグインにはXML SitemapsやAll In One SEO Packといったものがあります。
SEOの観点からみると、サイトマップは正確な内容で随時更新されることが重要です。手動で管理することで発生する人為的ミスや作業の手間を考慮するなら、サイトマップの更新は自動化してください。
HTMLサイトマップとは
WEBサイトに設置するサイトマップには、HTMLサイトマップとよばれるものもあります。HTMLサイトマップとはWEBサイト全体の構成を地図のように記載したものです。ユーザーが求める情報に辿り着く手助けをする役割も担います。
XMLサイトマップが検索エンジンのロボットにWEBサイトの情報を伝える役割を果たし、HTMLサイトマップはユーザビリティの向上に貢献します。いずれのサイトマップもSEOで評価されるWEBサイトに欠かせないものです。
インデックス登録させない設定
公開前のテストページや情報量が少ないページといったインデックスされたく無いページや検索エンジンの評価が不要なページの場合は、インデックスされることを拒否することもできます。
インデックス登録をブロックするためには、Googleが推奨するnoindexを使用してください。noindexを設定するためにはHTMLのhead要素内にmetaタグや、X-Robots-Tagレスポンスヘッダーを使用します。
なお、robots.txtファイルもインデックス登録をブロックしていると認識されます。しかし、ウェブページを検索結果に表示しないようにする目的でrobots.txtファイルを使用することは、Googleが推奨していません。
インデックスの状況を確認する方法
検索結果に自社WEBサイトを表示させるためには、インデックス登録されることが必須です。自社WEBサイトのページがインデックス登録されているか確認する方法は3つあります。
- site:のあとにURLを入力して検索
- GoogleサーチコンソールのURL検査
- Googleサーチコンソールのカバレッジレポート
site:のあとにURLを入力して検索
WEBページがインデックスされているか調べるもっとも簡単な方法は、ブラウザにsite:と当該URLを入力して検索することです。インデックス登録されていれば、WEBページの説明が検索結果に表示されます。
ただ、この方法は調べたいWEBページが多い場合には適しません。その都度URLを入力しなければならないため手間がかかります。自社のWEBページのインデックス状況を調べるなら、Googleサーチコンソールを活用してください。
GoogleサーチコンソールのURL検査
Googleサーチコンソールを利用すれば、インデックスされているか否かを容易に調べることが可能です。特定のWEBページのインデックス状況を確認する場合は、GoogleサーチコンソールのURL検査ツールを活用します。
GoogleサーチコンソールにログインしたらURL検索をクリックし、検査したいWEBページのURLを入力してください。

結果の画面に「URLはGoogleに登録されています」と表示されれば、インデックスされているため特別な対応は不要です。

Googleサーチコンソールのカバレッジレポート
WEBサイト全体のインデックス状況をひと目で把握するなら、Googleサーチコンソールのインデックスカバレッジを活用してください。インデックスカバレッジを参照すれば、インデックスの状況やWEBページで発生している問題を1つのページ内で確認することができます。

インデックスカバレッジでは、それぞれのWEBページを4つのステータスにわけて表示します。ステータスは次の4つです。
インデックスカバレッジレポートのステータス
ステータス | 意味 |
エラー | インデックスされていない |
警告 | インデックスされているが問題がある |
除外 | 意図的にインデックス登録していない |
有効 | WEBページの登録が完了している |
エラーもしくは警告に1以上の数字が表示されていれば、インデックス登録において何らかの問題が発生しています。エラー内容の詳細はカバレッジレポートの詳細欄に表示されるので、内容を確認し対処してください。
除外はnoindexの設定をしているか、すでにインデックス登録されているWEBページと重複しているためにインデックス登録されなかったページの数を意味しています。意図的にnoindexを設定したページ数と誤差がなければ、除外に1以上の数字が表示されていても問題はありません。
有効欄にはインデックスが完了しているWEBページの数が表示されています。
インデックスされていない場合の対処法
Googleは検索エンジンのロボットがWEBサイトに訪れるまでの期間は数日から数週間としています。WEBページを新しく作成もしくは変更したあと時間を置いてもインデックスされない場合は、検索エンジンにクロールをリクエストしてください。
クロールをリクエストする方法は2つあります。
- URL検査ツールからリクエスト
- XMLサイトマップを送信
クロールをリクエストするWEBページが少ない場合はURL検査ツールを、多い場合はサイトマップを使用すると効率よく作業できます。
URL検査ツールからリクエスト
GoogleサーチコンソールのURL検査で当該WEBページのインデックス状況を調べます。結果画面に「URLがGoogleに登録されていません」と表示される場合は、インデックスされていません。

この場合は「インデックス登録をリクエスト」をクリックして、WEBサイトの情報をインデックスするようリクエストします。

「インデックス登録をリクエスト済み」の画面が表示されれば、リクエストは完了です。
XMLサイトマップを送信
XMLサイトマップの情報はWEBサイトの更新や変更があるたびに更新される必要があります。
Googleサーチコンソールのサイトマップを開くと、登録済みのXMLサイトマップの更新状況を確認したり、新しいサイトマップを登録することができます。

インデックスされないときに見直すべきこと
検索エンジンがロボットは無数のサイトを巡回しています。WEBサイトの状況によってはロボットがWEBサイトを見落としたり、意図的にインデックスしないことも少なくありません。数日から数週間の期間待ってもインデックスされない場合は、WEBサイトに何らかの問題が発生している可能性を疑って確認してください。
インデックスされない理由となりえるため見直すべき要素には、次のようなものがあります。
- 重複コンテンツ
- ディレクトリ構造
- noindexやrobots.txt ファイル
- ペナルティ
重複コンテンツ
ほかのWEBページと重複している場合、重複コンテンツと判断されてインデックス登録されないことがあります。WEBページを作成する場合は必ずコピペチェックをおこなって、あらかじめ確認してください。
ディレクトリ構造
WEBサイトがわかりやすい構造であることは、ユーザビリティの観点のみならず検索エンジンのロボットがクロールしやすくする意味でも重要です。構造が複雑な場合、ロボットが隅々まで巡回できないことでインデックス登録されなくなる可能性もあります。
どのようにユーザーを誘導するか、全体構造を考えてシンプルなディレクトリ構造にするほか、パンくずリストも活用して誰もがわかりやすいWEBサイトを構築してください。なおパンくずリストの活用はGoogleが推奨しており、今や必須といえます。
noindexやrobots.txt ファイル
誤ってnoindexの設定をしている場合や、robots.txt ファイルで検索エンジンのロボットが巡回できないように設定している場合も、インデックス登録されません。
特にnoindexはWordPressの管理画面から容易に設定できるため、誤って意図しないページで設定している可能性も考えられるため注意してください。
まとめ
検索エンジンのロボットにクロールされ、さらにインデックス登録されることは、WEBサイトを運営するうえでの大前提です。インデックス登録されなければユーザーの目に触れることもなく、当然検索エンジンの評価を受けることもできません。WEBサイトを作成するために費やした時間や労力、費用は無駄になります。

- 前の記事
グロースマーケティングとは?注目される理由や進め方を徹底解説 2022.05.03
- 次の記事
クロスドメインとは?計測方法から動作確認方法までを徹底解説 2022.05.03