検索エンジンの3大構成要素とは
検索エンジンの3大構成要素についてです。
本日も、ご訪問頂きありがとうございます。
ブログランキングに参加しています。応援して頂けると嬉しいですu(_ _)u
→
検索エンジンの3大構成要素の1つめは、ネット上に存在する ウエブ情報を集める「クロール」要素。2つめは、その集めた情報から索引を作成し情報を引き出せるように整理する「インデックス」要素。そして3つめは、ユーザーの検索に対して 検索結果を出すまでのプロセス「クエリプロセス」要素。この3つが検索エンジンの構成要素となります。
1.クロール
検索対象のネット上に星屑のごとく散らばる、膨大なる情報を集める役割を勤めるのがクローリングです。それらのコンテンツを集めるロボットは「クローラー」または「スパイダー」と呼ばれています。
ウエブページを結びつけるリンク構造を辿りながら、世界にある数百億のウエブページを次から次へと果てしなく集めていきます。人力では無いのです。考えてみたら想像を絶する凄いロボットですね。ロボット型検索エンジンって世界の最高技術の集大成ではないでしょうか。
2.インデックス
クロールのプロセスを通じて収集した情報は、収集しただけでは、なんの意味もなさないのです。検索エンジンで、世の中の数千万人もの人々が常時、キーワードを検索窓に打ち込んで、検索要求をしてくる訳なのです。
その検索要求に対して、検索結果を表示するまで分、時間単位で待たされていてはこの時代、誰も利用することはないですよね。
検索エンジンは、数秒未満で検索に対しての答えを返すために、あらかじめ検索しやすいように書籍の巻頭についた目次や索引のようなものを作成しておくのです。これがインデックスと呼ばれるものです。
Yahoo!やGoogleは2008年4月現在、インデックスのサイズを公表していないのですが、インデックスのサイズは数百億単位のインデックスを持つと言われています。
あなたが、先ほど作ったブログもやり方によっては、クローラーやスパイダーがやってきて、検索エンジンにインデックスしてくれるのです。凄いですね!
3. クエリプロセス
クエリプロセスとは、ユーザーからの検索要求に対して、インデックスの中からキーワードに合致するウエブ内の文書を素早く見つけ出し、一覧リストを作成して検索結果を表示するまでのプロセスのことを言います。
しかし、単にキーワードを含むウエブページを適当にズラーっと表示しても、なんの意味もないですよね。ユーザーが入力したキーワードは、求める情報の断片をキーワード化したに過ぎないので、検索エンジンは、その検索要求キーワードに該当する、有益な情報を返す必要があるわけなのです。
そこで検索エンジンは、単に該当キーワードを含むだけでなく、適合性が高く、関連性が高く、信頼に値するウエブページから順番に並び替えてあげる必要があるわけなのです。
そこで、検索エンジンははWebページの適合性や関連性、信頼性などを格付けして、ランキング表示する必要があるという訳ですね。
検索エンジンを利用するユーザーが求め、必要とした情報を、すばやくレスポンスし探し出せる検索結果ほど、レリバンシー(relevancy=ページ内容の意味的な関連性)が高い「優れた」検索エンジンといえるのです。
本日も、ご訪問頂きありがとうございます。
ブログランキングに参加しています。応援して頂けると嬉しいですu(_ _)u
→
検索エンジンの3大構成要素の1つめは、ネット上に存在する ウエブ情報を集める「クロール」要素。2つめは、その集めた情報から索引を作成し情報を引き出せるように整理する「インデックス」要素。そして3つめは、ユーザーの検索に対して 検索結果を出すまでのプロセス「クエリプロセス」要素。この3つが検索エンジンの構成要素となります。1.クロール
検索対象のネット上に星屑のごとく散らばる、膨大なる情報を集める役割を勤めるのがクローリングです。それらのコンテンツを集めるロボットは「クローラー」または「スパイダー」と呼ばれています。
ウエブページを結びつけるリンク構造を辿りながら、世界にある数百億のウエブページを次から次へと果てしなく集めていきます。人力では無いのです。考えてみたら想像を絶する凄いロボットですね。ロボット型検索エンジンって世界の最高技術の集大成ではないでしょうか。
2.インデックス
クロールのプロセスを通じて収集した情報は、収集しただけでは、なんの意味もなさないのです。検索エンジンで、世の中の数千万人もの人々が常時、キーワードを検索窓に打ち込んで、検索要求をしてくる訳なのです。
その検索要求に対して、検索結果を表示するまで分、時間単位で待たされていてはこの時代、誰も利用することはないですよね。
検索エンジンは、数秒未満で検索に対しての答えを返すために、あらかじめ検索しやすいように書籍の巻頭についた目次や索引のようなものを作成しておくのです。これがインデックスと呼ばれるものです。
Yahoo!やGoogleは2008年4月現在、インデックスのサイズを公表していないのですが、インデックスのサイズは数百億単位のインデックスを持つと言われています。
あなたが、先ほど作ったブログもやり方によっては、クローラーやスパイダーがやってきて、検索エンジンにインデックスしてくれるのです。凄いですね!
3. クエリプロセス
クエリプロセスとは、ユーザーからの検索要求に対して、インデックスの中からキーワードに合致するウエブ内の文書を素早く見つけ出し、一覧リストを作成して検索結果を表示するまでのプロセスのことを言います。
しかし、単にキーワードを含むウエブページを適当にズラーっと表示しても、なんの意味もないですよね。ユーザーが入力したキーワードは、求める情報の断片をキーワード化したに過ぎないので、検索エンジンは、その検索要求キーワードに該当する、有益な情報を返す必要があるわけなのです。
そこで検索エンジンは、単に該当キーワードを含むだけでなく、適合性が高く、関連性が高く、信頼に値するウエブページから順番に並び替えてあげる必要があるわけなのです。
そこで、検索エンジンははWebページの適合性や関連性、信頼性などを格付けして、ランキング表示する必要があるという訳ですね。
検索エンジンを利用するユーザーが求め、必要とした情報を、すばやくレスポンスし探し出せる検索結果ほど、レリバンシー(relevancy=ページ内容の意味的な関連性)が高い「優れた」検索エンジンといえるのです。


