Jump to Content

Google 検索が​情報を​整理する​仕組み

ユーザーが​ Google 検索を​使用すると、​Google は​有用な​情報を​見つける​ために​ Google 検索インデックスで​整理されている​何千億もの​ウェブページや​その​他の​デジタル コンテンツを​調べます。​これは​世界中の​図書館を​すべて​合わせても​まだ​足りない​ほどの​豊富な​情報量です。

記事、動画、広告などの検索結果のコラージュ
テーマ別に整理され、分類された検索結果

クロールに​よる​情報の​発見

Google の​検索インデックスの​大部分は、​クローラーと​呼ばれる​ソフトウェアの​働きに​よって​構築されます。​クローラーは、​ユーザーが​ウェブ上で​コンテンツを​閲覧する​ときと​同じように、​一般​公開されている​ウェブページに​アクセスし、​ページ上の​リンクを​たどると​いう​操作を​自動で​行います。​クローラーは​ページ間を​移動し、​ページ上で​確認した​内容や​その​他の​一般​公開されている​内容に​ついての​情報を​ Google の​検索インデックスに​整理します。
Google の検索インデックスがカバーしているさまざまなソースのイラスト

コンテンツの​並べ替えと​整理

クローラーが​ウェブページを​見つけると、​Google の​システムが​ブラウザと​同じように​ページの​コンテンツを​表示します。​Google では​キーワードや​ウェブサイトの​新しさと​いった​主要な​シグナルに​注目し、​検索インデックスに​その​情報を​すべて​記録しています。

Google 検索インデックスは​何千億と​いう​ウェブページを​カバーしており、​サイズは​ 1 億ギガバイトを​はるかに​超えています。​Google の​インデックスには、​本の​巻末に​ある​索引と​同じように、​各ウェブページに​含まれている​すべての​語が​ 1 つずつ​追加されています。

Google では、​有料で​サイトの​クロール頻度を​増やす​ことは​行っていません。​すべての​ウェブサイトに​同じ​ツールを​提供し、​ユーザーに​とって​最適な​検索結果を​表示できるように​しています。

絶えず​新しい​情報を​処理

ウェブや​その​他の​コンテンツは​常に​変化している​ため、​Google は​クロール プロセスを​継続的に​実行して​最新の​状態を​保っています。​クローラーは​以前に​確認した​コンテンツが​どれくらいの​頻度で​変更されているかを​学習し、​必要に​応じて​再度アクセスします。​また、​そうした​ページまたは​情報への​新しい​リンクが​公開された​場合には、​クローラーは​新しい​コンテンツを​探します。

Google は、Search Consoleと​呼ばれる​無料の​ツールセットも​提供しています。​クリエイターは​この​ツールを​使用する​ことで、​コンテンツが​適切に​クロールされるように​する​ことができます。​クリエイターはサイトマップや​ robots.txt と​いった​確立された​標準を​利用する​ことも​できます。

Google では、​有料で​サイトの​クロール頻度を​増やす​ことは​行っていません。​すべての​ウェブサイトに​同じ​ツールを​提供し、​ユーザーに​とって​最適な​検索結果を​表示できるように​しています。

テーマ別に整理され、分類された検索結果

ウェブページ​以外も​インデックスに​登録

Google の​検索インデックスが​カバーしているのは​ウェブ上に​存在する​ものだけでは​ありません。​有用な​情報が​別の​ソースに​存在する​可能性も​あるからです。

実際、​Google には​さまざまな​タイプの​情報の​インデックスが​いくつも​存在しています。​これは​クロールを​通じて、​パートナーシップを​通じて、​Google に​送られる​データフィードを​通じて、​そして​ Google 独自の​事実の​百科事典であるナレッジグラフを​通じて​収集された​ものです。

こうした​大量の​インデックスに​より、​ユーザーは​大きな​図書館の何百万もの​蔵書から​検索したり、地域の​公共交通機関の​移動時間を​調べたり、世界銀行のような​公開されている​ソースの​データを​調べたりできます。