Googleの情報取得方法とインデックス登録について解説

googleの情報取得方法

GoogleのSEO検索結果の表示は、Googleのロボットによってなされます。Googlebot(グーグルのロボット)はURLを検出するとクロール(サイトへアクセス)してそのサイトをインデックス(登録)します。Googleの巨大データベースをGoogleインデックスと言います。

 

Googlebotの情報取得方法

サイトページをレンダリング(データに処理や演算を行い画像や映像を生成すること)してテキストコンテンツとそれ以外のコンテンツなどの視覚的配置を分析して検索結果のどこに表示するかを決めます。そのために、Googleのロボットは様々な情報源を頼りにしています。

 

例えば・・・

  • WEBページ
  • Google マイビジネスやマップなど
  • 書籍、PDFのスキャン
  • インターネット上の公開データベース

 

Googlebotがクロールしてサイト情報をインデックスしていくので、ここでクロールしやすいサイトがユーザーに表示されやすくなるので、SEO対策として、”クローラビリティ”が重要になってくるのです。Googlebotは、インターネット上の数十億のWEBページをクロールして取得します。Googlebot はアルゴリズム処理を使用し、それによってクロールするサイトやクロール頻度と取得するページ数を決めます。

 

クローラビリティの改善で確認すること

ROBOT

  • ページが Google からアクセス可能な状態になっているか
  • NOINDEXタグが入っていないか:<meta name=”robots” content=”noindex”>
  • サイトマップをGoogleに送信する
  • TOPページからすべてのページへ内部リンクをはる
  • サイトでナビゲーション用に URLパラメータを使用する場合、重要なパラメータについて Google に伝えます。
  • robots.txt を使用して、Google に最初にクロールしてほしいページを知らせる。
  • hreflangでページの別言語バージョンを指定。
  • Google search consoleで URL 検査ツールでGoogle によるアクセスとレンダリングが問題なく行えることを確認。

 

インデックス登録

インデックス登録とは、Googleが、コンテンツをレンダリングし、Googleインデックスに情報を保存します。Googleインデックスは巨大なデータベースです。

インデックスされやすくするために、ページタイトルは短くわかりやすくしメタディスクリプション、見出しタグをつけましょう。画像よりもテキストを使用して、画像の場合は必ず代替テキストやalt属性を使います。

Google は、そのWEBページが別のWEBページの類似ページでないかチェックします。WEBページが重複ページと判断されてしまうとそのページのクロール(アクセス)頻度が落ちます。類似ページと判断されたページは「ドキュメント」にグループ化され類似ページの集まりとしてクロールされなくなります。

 

検索結果の表示

検索結果の表示を改善するためには、モバイルフレンドリーで、表示スピードを速くする必要があります。Googleは日々、検索アルゴリズムの改善を行っており、ユーザーが探している情報と関連性が高い情報を表示できるようにしています。

よって、ユーザーが望む良質で新鮮なコンテンツを作成し必ずウェブマスター向けガイドライン(品質に関するガイドライン)を遵守しましょう。

 

 

この記事の監修者

SEOコンサルタント

アドマノ株式会社 代表取締役 天野 剛志

日本大学法学部卒業、広告代理店で12年間働いている間、SEOと出会い、SEO草創期からSEO研究を始める。SEOを独学で研究し100以上のサイトで実験と検証を繰り返しました。そのノウハウを元に起業し現在、10期目。営業、SEOコンサル、WEB解析(Googleアナリティクス個人認定資格GAIQ保持)コーディング、サイト制作となんでもこなす。会社としては今まで2000以上のサイトのSEO対策を手掛けてきました。

新着記事

人気記事

海外SEOメディア記事

おすすめ記事

SEO初心者向け記事

SEO上級者向け記事

SEOライティング記事

SEO外部リンク記事