WebサイトのURLとは?決め方や一括抽出する方法を徹底解説
どのサイトやページにもかならず設定されているのが、インターネット上の住所を示す「URL」です。Webサイトを運営するうえではドメインを取得する必要があるため、URLに関する知識は必須といえるでしょう。

サイトのURLとは
URLとは「Uniform Resource Locator」の略となり、インターネット上でWebサイトの住所を示す役割をもちます。
通常コンピューターはIPアドレスと呼ばれる数字の文字列によって、各Webサイトの住所を表す仕組みです。しかしIPアドレスは数字のみで構成され、人間には分かりづらいといったデメリットがあります。
そこで人間でもIPアドレスを分かりやすいように表記したものがURLです。複数の要素によって構成されたURLは世界共通となり、文字から該当するWebサイトを判断できます。
したがってインターネットが当たり前となった現代では、Webサイトの活用にはURLが欠かせない存在です。
サイトURLを構成する8要素
サイトURLは主に、以下の8要素から構成されます。
- プロトコル
- スキーム
- ホスト名
- トップレベルドメイン
- セカンドレベルドメイン
- サードレベルドメイン
- ディレクトリ
- ファイル名
URLによってはサードドメインが存在しない場合もありますが、基本的な仕組みはどのURLも共通です。ここではサイトURLを構成する8要素について、詳しく解説していきます。
プロトコル
プロトコルとはコンピューターが通信する際のルールを意味し、URLの「http」に該当します。
用途によってプロトコルの役割が決まっており、さまざまな種類が存在します。
- http:Webブラウザとサーバーが通信を行うためのプロトコル
- https:httpよりも安全に通信を行う際に使用するプロトコル
- smtp:インターネット上でメールを送信するためのプロトコル
- pop3:インターネット上でメールを受信するためのプロトコル
一般的なWebサイトで使用されるのは「http」と「https」です。「https」は、SSLとTLSといった暗号化の機能が加わったものとなり、データを安全に通信できます。
スキーム
スキームとはプロトコルで定めたルールを規定することを意味し、URLの「http://」に該当します。
プロトコルではあくまで通信時のルールを表したものとなり、スキームによって手段として確立し「//」以降の内容を命令する仕組みです。
プロトコルと混同しやすいですが、URLを正常に機能するためには欠かせない要素だと覚えておきましょう。
ホスト名
ホスト名とはインターネットに接続しているコンピューターの名前を意味し、URLの「www.」に該当します。
ホスト名は自由に設定でき、広く使われているのがWorld Wide Webの略となる「www」です。
またホスト名はIPアドレスを文字化している部分となり、後述の「ドメイン」と組み合わせてFQDNとも呼びます。
それぞれのイメージとしては、以下になります。
- ホスト名:ネットワークにおけるコンピューターの名前
- ドメイン名:インターネットにおけるネットワークの名前
- FQDN:ネットワーク内のコンピューターを特定する名前
各々似ている要素ではありますが、具体的には違うことを表すと覚えておきましょう。
トップレベルドメイン
トップレベルドメインとは「example.co.jp」の「jp」に該当する部分です。
ドメインにはさまざまな種類がありますが、大きく分けると2種類になります。
- ccTLD(国別トップレベルドメイン):取得した地域や国を示す、国コード別に存在するドメイン
- gTLD(分野別トップレベルドメイン):分野などを示す、世界共通で取得が可能なドメイン
ccTLDは日本を示す「jp」や米国を示す「us」など、基本的に住んでいる地域や国の名前を取得できます。
gTLDは誰もが取得できる「com」や「net」をはじめ、取得に条件がある「gov」や「mil」用途に応じてさまざまな種類があります。
セカンドレベルドメイン
セカンドレベルドメインとは「example.co.jp」の「co」に該当する部分です。名前のとおり、トップレベルドメインの左に位置するドメインを示します。
トップレベルドメインが「jp」の場合は、以下のようなセカンドレベルドメインが割り当てられます。
- co:企業を示すドメイン
- or:非営利法人を示すドメイン
- ne:ネットワークサービスを示すドメイン
- go:政府機関を示すドメイン
- ac:大学などを示すドメイン
ただしトップレベルドメインが「com」や「net」の場合は、特定のセカンドレベルドメインが存在しません。
そのため後述のサードレベルドメインがセカンドレベルドメインとなります。
サードレベルドメイン
サードレベルドメインとは「example.co.jp」の「example」に該当する部分です。
名前のとおり、セカンドレベルドメインの左に位置するドメインを示します。サードレベルドメインでは個人の名称を示す場合が多く、自由に設定できます。ただしサードレベルドメインでは、重複した単語を設定できない点に注意をしましょう。
ディレクトリ
ディレクトリとはドメインの右に「/」に続いて表記し、サーバー内のフォルダ名や階層を示します。
そのため「example.co.jp」内の「abc」フォルダを示す場合は「example.co.jp/abc」と表記し、さらに「zzz」フォルダを加える場合には「example.co.jp/abc/zzz」と表記します。
ファイル名
ファイル名とはURLの末端に位置し、拡張子などが表記されている文字に該当する部分です。
仮に「example.co.jp/abc/ppp.html」というURLの場合、abcフォルダ内の「ppp.htm」ファイルが表示される仕組みとなります。
またHTMLファイル名を「index」にした場合に限定して、ファイル名を省略して表示する点が特徴です。
本来は「example.co.jp/index.html」と表記されますが、index部分が省略され「example.co.jp」と表示されます。そしてファイル名の指定がなくても表示されるページをトップページと呼びます。
サイトURLの決め方
サイトのURLを決める際は企業や店舗のイメージをもちやすいことや、短く分かりやすいことが重要です。仮にURLが企業やWebサイトとまったく違う内容であれば、ユーザーは違和感をもってしまうため注意をしましょう。
ここでは、サイトURLの決め方について詳しく解説していきます。
店舗やサービス内容が分かる
URLを設定する際は、店舗やサービス内容のイメージが付きやすい名前を設定しましょう。
企業であれば「企業名.com」などで設定すると、ひと目で企業のWebサイトを表していることが分かります。
例えば「株式会社山田工業」の場合、以下のようなURLがおすすめです。
- yamadakougyou.com
- yamada-kougyou.jp
単語が長く読みづらい場合には「- (ハイフン)」で区切ると読みやすくなります。
また木材系を扱う企業の場合は「wood」や、水を販売している企業の場合は「water」など、企業に関連する単語の活用も覚えやすく効果的といえるでしょう。
短く分かりやすい
サイトのURLは、ユーザーが分かりやすいように短く設定することが重要です。
仮に長いURLの場合、企業や店舗の内容が分かったとしても、入力時に間違えやすいなどのデメリットがあります。
またURLに続くディレクトリやファイル名を考えると、全体がさらに長くなり分かりづらいURLとなってしまうでしょう。
そのため「山田グループインターナショナル株式会社」が企業名だとしても、すべてを含めるのではなく「yamada-group.com」などの短さが適しています。
企業を表していることが最低限分かれば問題ないため、極力短く分かりやすいURL名がおすすめです。
信頼性の高いドメインを利用する
ドメインによって直接的に悪影響を及ぼすことはありませんが、企業のURLであれば「.co.jp」を選ぶなど、できるだけ信頼性の高いドメインの使用をおすすめします。
実際に日本の上場企業の9割以上が「.co.jp」を使用しており、ドメイン名の印象は重要視される要素です。
仮に大手企業のドメインが「.blog」であれば、違和感をもつユーザーもいるでしょう。
そのため「.co.jp」の他にも人気のある「.com」や「.net」など、多くのWebサイトで使用されているドメインを活用するほうが企業のイメージを落とすこともありません。
ドメイン名で目立ちたいと考えている以外の場合は、基本的に広く活用されている信頼性の高いドメインを利用しましょう。
サイトURLを決めるときの注意点
サイトのURLは設定できる文字や文字数が決められており、一度設定したURLを変更はできません。仮にURLを変更したい場合は新しいドメインの取得から始まるため、設置する際は責任をもって決めましょう。
ここでは、サイトURLを決めるときの注意点について詳しく解説していきます。
一度決めたら変更できない
基本的にURL名は一度設定したら変更できないため、適当に決めることがないように注意をしましょう。
仮にURL名を変更する場合は新しくドメインを取得するなど、お金も時間も必要です。
また長年Webサイトを運営し検索結果で上位に表示されているサイトであれば、積み重ねてきたSEOの評価も無くなってしまいます。
再度SEOで上位に表示するには半年以上かけて対策する必要があるため、簡単ではありません。したがってURL名を決める際は、後から後悔することがないように意識し設定しましょう。
アルファベット・数字・ハイフン以外は使用できない
URLの設定では、使用できるのがアルファベット・数字・ハイフンに限定されます。
そのため記号や絵文字などを使用できません。
またドメインにおいては3文字以上63文字以内の制限があるため、長い名前の設定ができない点には注意をしましょう。
基本的には前述の「サイトURLの決め方」であった条件を意識し、アルファベットとハイフンを軸に設定することをおすすめします。
同一のアドレスは使用できない
同一のURLはインターネット上に存在出来ないため、すでに使用されている文字列は使用できません。
特に人気のあるドメインを取得する際は、自分が求めていた文字列が使用できないこともあるため注意をしましょう。
例えば「.com」や「.co.jp」が挙げられます。企業名によっては全国で複数存在することもあり、使用できない場合が多いといえるでしょう。
もしもすでに使用されている場合は、セカンドレベルドメインやサードレベルドメインを変更すると使用できるようになります。どうしてもドメイン被りが解消されないようであれば、トップレベルドメインを変更して対処しましょう。
サイトのURLを抽出する方法
サイトには公開されている数のURLが存在するため、長い年月運営しているWebサイトではすべてのURLを網羅することは大変な作業です。また内部リンク数や外部リンク数を考えると、把握しきれないほどの情報量になります。
ここではサイトのURLを抽出する方法について、無料ツールに厳選して詳しく解説していきます。
ページ一覧取得
サイト内のURL一覧を取得したい場合には「ページ一覧取得」を活用しましょう。
使用方法は以下のとおりです。
- 基点となるページ:サイトのドメインを入力
- 再帰取得レベル:基本的には「0」を入力、サイトの階層が深い場合には「1」から設定する
- 除外:PDFかJPGを除く場合にはチェック欄を選択
- 出力:「プレーンテキスト」・「リスト」・「タイトル+URL」から選択
- 並び替え:「する」・「しない」を選択
出力では「タイトル+URL」を設定でき、抽出したデータを分かりやすく表示できる点が強みです。簡単な操作で設定できるため、まとめてURLを抽出したい場合には活用すべきサイトになります。
内部リンク取得
指定のURLに関連する内部リンクを取得したい場合には「Sucuri SiteCheck」を活用しましょう。
使用方法は以下のとおりです。
- 基点となるページのURLを入力
- 「ウェブサイトをスキャンする」をクリック
- 「詳細」から「リンクが見つかりました」をクリック
- 内部リンクが一覧で表示
URLを入力すると高速でスキャンされ、内部リンクの一覧を確認できます。
内部リンクを取得する際は、できるだけTOPページや関連ページを多く含むURLを入力しましょう。
関連記事: 内部リンクとは?SEO強化のための内部リンクのポイント
外部リンク取得
指定のURLに関連する外部リンクを取得したい場合には「SEOTOOLS」を活用しましょう。
使用方法は以下のとおりです。
- 「解析するサイト」に基点となるページのURLを入力
- 「SEO解析」をクリック
- 解析結果の「被リンク数」を確認
「SEOTOOLS」もURLを入力するだけで簡単に被リンク数を確認できるツールです。
リンクの数だけでなく10段階のポイント評価が表示される点も、分かりやすい特徴となります。
また「SEOTOOLS」はSEO解析ツールのため、キーワード率やページランクなど、Webサイト情報を複数確認できる点が強みです。
関連記事: 被リンクチェックツール8選!被リンクのチェック方法とポイントを解説
