コンテンツにスキップ

2

検索システム

検索システムとは、一般的に検索エンジン(Google、Bing、DuckDuckGoなど)と呼ばれるものです。これらは、テクノロジー史上最も大きな課題のいくつかを取り組む、非常に複雑なシステムです。

検索システムには4つの主な責任があります

  • クロール:Webを巡回し、すべてのウェブサイトのコンテンツを解析するプロセス。利用可能なドメインは3億5000万件以上あるため、これは非常に大きなタスクです。
  • インデックス作成:クロール段階で収集したすべてのデータを格納する場所を見つけることで、アクセスできるようにします。
  • レンダリング:JavaScriptなどのページ上のリソースを実行し、サイトの機能強化やコンテンツの充実を図ること。このプロセスは、クロールされたすべてのページで行われるわけではなく、コンテンツが実際にインデックス化される前に行われることもあります。クロールの時点でタスクを実行するためのリソースがない場合、インデックス作成後に行われることもあります。
  • ランキング:ユーザーの入力に基づいて関連性の高い検索結果ページを作成するために、データをクエリすること。ここで、検索エンジンはさまざまなランキング基準を適用して、ユーザーの意図を最もよく満たす最適な回答を提供します。

次のセクションでは、Googlebotがどのように機能するかを具体的に学びます。GooglebotはGoogleのインターネットクローラーであり、検索結果を提供する大規模なコンテンツデータベースを作成するために必要なすべての情報を収集する検索システムの一部です。

チャプターを完了しました。2

次へ

3:Webクローラーとは?