Googleの情報取得方法とインデックス登録について解説
GoogleのSEO検索結果の表示は、Googleのロボットによってなされます。Googlebot(グーグルのロボット)はURLを検出するとクロール(サイトへアクセス)してそのサイトをインデックス(登録)します。Googleの巨大データベースをGoogleインデックスと言います。
Googlebotの情報取得方法
サイトページをレンダリング(データに処理や演算を行い画像や映像を生成すること)してテキストコンテンツとそれ以外のコンテンツなどの視覚的配置を分析して検索結果のどこに表示するかを決めます。そのために、Googleのロボットは様々な情報源を頼りにしています。
例えば・・・
- WEBページ
- Google マイビジネスやマップなど
- 書籍、PDFのスキャン
- インターネット上の公開データベース
Googlebotがクロールしてサイト情報をインデックスしていくので、ここでクロールしやすいサイトがユーザーに表示されやすくなるので、SEO対策として、”クローラビリティ”が重要になってくるのです。Googlebotは、インターネット上の数十億のWEBページをクロールして取得します。Googlebot はアルゴリズム処理を使用し、それによってクロールするサイトやクロール頻度と取得するページ数を決めます。
クローラビリティの改善で確認すること
- ページが Google からアクセス可能な状態になっているか
- NOINDEXタグが入っていないか:<meta name=”robots” content=”noindex”>
- サイトマップをGoogleに送信する
- TOPページからすべてのページへ内部リンクをはる
- サイトでナビゲーション用に URLパラメータを使用する場合、重要なパラメータについて Google に伝えます。
- robots.txt を使用して、Google に最初にクロールしてほしいページを知らせる。
- hreflangでページの別言語バージョンを指定。
- Google search consoleで URL 検査ツールでGoogle によるアクセスとレンダリングが問題なく行えることを確認。
インデックス登録
インデックス登録とは、Googleが、コンテンツをレンダリングし、Googleインデックスに情報を保存します。Googleインデックスは巨大なデータベースです。
インデックスされやすくするために、ページタイトルは短くわかりやすくしメタディスクリプション、見出しタグをつけましょう。画像よりもテキストを使用して、画像の場合は必ず代替テキストやalt属性を使います。
Google は、そのWEBページが別のWEBページの類似ページでないかチェックします。WEBページが重複ページと判断されてしまうとそのページのクロール(アクセス)頻度が落ちます。類似ページと判断されたページは「ドキュメント」にグループ化され類似ページの集まりとしてクロールされなくなります。
検索結果の表示
検索結果の表示を改善するためには、モバイルフレンドリーで、表示スピードを速くする必要があります。Googleは日々、検索アルゴリズムの改善を行っており、ユーザーが探している情報と関連性が高い情報を表示できるようにしています。
よって、ユーザーが望む良質で新鮮なコンテンツを作成し必ずウェブマスター向けガイドライン(品質に関するガイドライン)を遵守しましょう。