企画・制作・システム開発・PR・運用までワンストップサービス

検索エンジンの仕組みの理解がSEOを正しく理解する近道だ

作成日:2015.08.25

最終更新日:2016.05.31

カテゴリー:SEO

  • twitter
  • このエントリーをはてなブックマークに追加

普段意識することもなく使っているGoogleなどの検索エンジン。
すごいテクノロジーだと言われていますし、理解するのは絶対に無理だと思っているかもしれません。

しかし、そんなことはありません。
検索エンジンの根本的な動作原理は全然難しいものではなく、非常にシンプルなものです。コンピューターの知識がほとんどなくても20分もあれば理解できる、というぐらい簡単です。

しかし、これを一度正しく理解しておくとSEOにおいて非常に大きく役に立ちます。ですから、Webサイトの担当者や制作者は、検索エンジンの仕組みを絶対に理解しておくべきです。

1.なぜ検索エンジンの仕組みを知っていたほうがよいのか?

1-1.正しいSEOの基準がわかる

書籍や様々なWebサイトなどでSEOのテクニックは溢れまくっています。
間違っている情報も多数あります。また間違ってはいないものの知らなくていい情報が多くを占めています。

「どれが正しくどれが間違っている」
「どれが重要でどれが重要でないか」

を知るための基準を自分の中に作ることができることができるのです。これがとてもとても重要です。

詳細:「SEOとは」恒久的に安定的な集客をもたらす考え方

1-2.実際の運用で大事な応用力が付く

SEO手法が、Webサイトの使い勝手やデザイン、CMSの機能の制限、予算といった他の要件と衝突することはよくあることです。その際に、検索エンジンについて正しい理解があれば、うまく折り合いをつけるためのさまざまな策を立案することができます。

数学の問題で公式だけ覚えていても応用が利きません。数学が不得意な生徒は公式を丸暗記しようとしますが、これでは公式がそのまま適用できる問題しか解くことができません。

公式を導いた過程を理解して初めて応用が利くのです。

SEOもこれと一緒で、手法を知っているだけでは十分ではありません。なぜその手法が有効なのかを理解すれば、その手法が使えなかった時でも、なんらかの別の手段を使ってSEOで達成すべき目的を成し遂げることができるでしょう。

このように現実に即して実現可能な解決策を立案、実行するためには、検索エンジンに対する本質的な仕組みの理解が不可欠なのです。

1-3.SEOのみに必要なHTMLのタグ、設定ファイルについて理解できるようになる

Webサイトを閲覧するユーザーにはほとんど関係がなく、検索エンジンの動作にだけ関係するHTMLのタグが近年多くなってきています。canonical属性、nofollow属性、noindex属性などいろいろあります。
また、robots.txtや.htaccessといった検索エンジンをコントロールするためのファイルを正しく設定するためも正しい理解が必要です。
正しい仕組みへの理解がないと誤って設定してしまうことになります。そうすると、最悪検索結果に表示されなくなるといった事態につながります。このような誤った設定がなされることは珍しいことではありません。その結果検索結果に表示されなくなったり、検索順位が大きく下落してしまう事故も時折あります。

このような事故を防ぐためにも検索エンジンの仕組みを正しく理解することが必要なのです。

2.検索エンジンを構成する3要素

Googleは巨大なシステムであるということは有名ですが、検索エンジンはGoogleのような巨大システムだけではありません。

事務所内にある様々なWord文書などを検索するための、サーバーコンピューター1台だけで動作する小規模な検索エンジンを使っていらっしゃる方も多いでしょう。
Googleという検索エンジンのシステムは、サーバーコンピューター数百万台が稼働する非常に大規模なものといわれていますが、動作原理としては前述のような小規模な検索エンジンと大きく変わりません。
Googleは処理する文書の数・使うユーザーの数が膨大であるためにそれほど多くのコンピューターが必要なわけですが、本質的な部分に必要な要素はたった3つしかありません。

検索エンジンの技術要素・動作原理と仕組み

a. クローラー(crawler)
インターネット上にあるHTMLのページ、PDF、画像などのデーターを収集するプログラム

b. インデクサー(indexer)
クローラによって集められたデーターを、必要に応じて瞬時に取り出せるようなデータ形式に変換して保存する

c. サーチャー(searcher)
保存されたデータの中から必要なデータだけを取り出し、順位付けをした検索結果を検索のリクエストがあったパソコンに対して送信する。

この3つの構成要素が連携して一つのシステムとして動作しています。さて、これらがどのような働きをしているのか?を順を追って見ていきましょう。

  1. クローリング(crawling)
    検索エンジンに記憶すべき情報を集めるプロセスです。クローラーがインターネット上にあるWebページのリンクをたどりながらHTML・PDF・画像などのデーターを取得します。
    クローリングの模式図
    上記の図のように、ページ内にあるリンクをたどって、リンク先のページを次々と人間が訪問するのと同じような要領で、検索エンジンが別のページを次々と巡回していく過程がクローリングです。
    リンクをたどっていくのが原則なのですが、XMLサイトマップやRSSといった、リンク以外の要素からもURLを取得してクローリングは行われます。
  2. インデキシング(indexing)
    クローラーが取得したデーターを蓄積することです。
    クローラーが発見したページをインデクサーが読み込んで、まるまるコピーして保存します。
    また、コピーする際に巨大なページのデータに、要求に応じて瞬時に必要なデータを提供するために、索引に相当するデータを付与します。この索引のことをインデックスと言います。
    国語辞典はあいうえお順に並んでいるので、あんなに分厚い本であってもすぐに知りたい言葉の項目を探すことができます。検索エンジンは収集したページのデータにこのような処理を施すのです。
    インデックスが付与されたデーターを蓄積する処理が終了して、初めて検索結果に表示される対象となるのです。
  3. クエリ(query)実行
    ユーザーが行った検索キーワード(及び同義語)を含むページのデータを、インデックスを用いて取り出す事です。
    クエリとは大規模なデータを扱うシステムに対して、データの取得や加工をリクエストすることを一般的には指します。検索エンジンでいうところのクエリとは、検索をする操作を指すのです。
  4. スコアリング(scoring)
    サーチャーはインデクサーから検索結果の対象となるデータを取得して、優先順位に従って並べ替えを行います。
    この優先順位を決める規則を「アルゴリズム」といい、このアルゴリズムの優劣が検索エンジンの性能を評価する上で重要なポイントを占めます。

検索エンジンが動作する原理はたったこれだけしかありません。
これを覚えておくとSEOの様々な技術について、

「なぜそれが有効なのか」がわかるのです。

3.検索エンジンの仕組みからSEOを理解する

「SEOの技術」とは何でしょう?

一言で言えば「検索エンジンに自分のWebサイトのページの価値を正しく理解してもらうために手助けをする」ことです。
検索エンジンは基本的にはページの価値を判定し、価値の高い順番に(検索キーワードについて役に立つ順番に)並べ替えて表示します。
その際に、SEOの技術に対する正しい理解がないと、検索エンジンにページの価値を正しく理解してもらえないということが起こります。もともとはページの価値が100あるにもかかわらず、50や20と認識されたり、最悪のケースではまったく認識されなかったりもするのです。

どうすればWebサイトのページの価値を正しく理解してもらえるのか。
それがSEOの重要なポイントなのですが、そのために前述の仕組みの理解が役立ちます。

検索エンジンの動きの各ステップがスムーズに動作するようすること。これがSEOの技術なのです。
それぞれのステップごとに、何をすべきかを見ていきましょう。

  1. クローリング
    必要なページが正しく検索エンジンに認識されなければなりません。
    どんなに役立つページを作っても、クローラーが訪れることができなければ、そのページは検索エンジンにとって存在しないのと同じことです。
    そのため、クローラーがくまなく、無駄なくサイト内を巡回できるようにする必要があります。そのためには、以下の3つの配慮を行う必要があります。
    ・ クローリングの阻害要因を取り除く
    ・クローリングを促進する仕組みを導入する
    ・検索結果に表示される必要のないページはクローリングさせないようにしてクローラーの負荷を減らす
    (詳細:すべてはクローリングから始まる|SEOの最重要技術要素を理解しよう
  2. インデキシング
    ページの存在自体を検索エンジンが認識できても、内容について検索エンジンが正しく把握できないと意味がありません。そのため以下の配慮が必要です。
    ・ ページ内の情報を正確に、漏れなく記録できるようにする
    ・情報を検索エンジンにとって理解しやすく整理して記述する
  3. クエリ実行
    検索が行われない情報しかないページはSEOの観点からは存在しないのと同義です。ユーザーを想定して検索ニーズにあったキーワードを対象にして情報を作る必要があります。
  4. スコアリング
    検索エンジンは、ユーザーニーズの大小に基づいて検索順位を並べ替えています。
    ですから、検索エンジンがどのようにユーザーニーズを把握しようとしているのかを理解してWebサイトを作成する必要があります。

SEOの技術的な観点において必要なことを書き表すと以上のようになります。
様々なSEOに必要な施策は、このうちのいずれかに寄与するものでなくてはなりません。
これをよく理解しましょう。

「知識と知恵」

という二つの言葉があります。
「知識」を深く体得して応用する力を「知恵」といいます。
上記の原理を理解することで、SEOの知識を様々な場面で臨機応変に応用することが可能になります。SEOの技術について学んだら、上記のどこに関連するのか?を意識してみてください。一見遠回りのようですがSEOの上達の早道となります。

プロの技全公開!SEO対策チェックリスト102項目【PDF付】

もうすでにSEOについて勉強されている方であれば、これをご覧いただいて一つ一つの項目がどこに該当するのかを考えながら読まれると理解を深めることができると思います。このSEOについての勉強法は非常におすすめです。

4.スコアリングの原理について理解する

Googleのアルゴリズムはどのようなものなのでしょうか?

スコアリングはあるキーワードを検索したユーザーに対して、役に立つ順番で表示することを目的として作られています。
スコアリングについて知っておくべき本質としてはたったこれだけです。

要は、

あるキーワードで上位に表示させたければ、他の競合のページよりもユーザーに役にたつページを作れ

これだけなのです。

4-1.スコアリングの本質を理解しないと正しいテクニックはわからない

いわゆるSEOのテクニックと呼ばれるものの多くは、スコアリングに関係するものです。
身も蓋もない言い方をすると「どうすれば検索順位が上がるか?」ということですね。

本質を理解した上でテクニックに触れることで、なぜそのテクニックは有用なのか?が深く理解出来るようになります。
逆に本質を理解しないでテクニックに触れると、誤ったSEOを行ってしまうことにつながります。

「こうすれば順位が上がる。」というようなテクニックはたくさんあります。
しかし、この本質から逸脱しているものは正しくないテクニックであり、一時的には有効であってもいずれは効かなくなるのです。

それは「検索意図を検索エンジンは理解して合致するページを上位に表示しようとする」からなのです。
毎年600とも言われる改善を続けている検索エンジンはこの種のテクニックを日々無効にするようにしています。

数年前はこの種の裏技的なテクニックがもてはやされていましたが、今はほとんどもうそんなテクニックを使うことを推奨している人はいません。もうそんなものはないのです。
スコアリングの本質を理解しないでテクニックを学ぶと、誤ったSEOを猿まねしてしまう危険があることを覚えておいてください。

5.まとめ

検索エンジンの仕組みは

  1. クローラー
  2. インデクサー
  3. サーチャー

のこの3つに大きく分割されます。

SEOを行うとき、一番重要になるのは「サーチャー」です。動作するスコアリングが順位計算を司っているからですね。この根本を理解することがまず重要です。

しかし、「クローラー」「インデクサー」が正常に動作しなければそもそも正常にページを検索エンジンが読み込んで記録することができません。

最後に簡単におさらいしますと、

  • クローラーが必要十分に自分のWebサイトを巡回できるようにする。
  • インデクサーが個々のページを理解できるようにする。
  • サーチャーが上位に表示しようとする、ユーザーニーズの高いページを作る。

この3つを理解して実践することがSEOなのです。

pagetop