Jump to Content

厳格な​テストで​検索を​改善

Google は​常に、​有益で​関連性の​高い​情報を​ユーザーに​提供する​ことを​目指しています。​Google 検索への​改善は、​検索結果の​利便性を​高める​ことを​目的と​しています。

さまざまなアバターのピンが世界の各大陸に表示されたイラスト

実際の​ユーザーが​ Google 検索を​どのように​改善しているかを​確認する

有用性の​テスト

Google 検索は、​ユーザーの​ニーズや​期待の​高まりに​応える​ため、​長年に​わたって​進化を​遂げてきました。ナレッジグラフのような​イノベーションから、​関連性が​高い​コンテンツを​常に​表示できるように​する​ランキング アルゴリズムの​更新に​至るまで、​Google は​検索結果が​有用な​ものに​なるよう継続的な​取り組みを​続けています。​それが​広告主様が​広告費を​支払う​ことで、​ページ内の​広告用と​明示された​場所に​広告を​掲載する​ことができる​理由でもあります。しかし、​いくら​お金を​払っても、​検索結果​内での​掲載順位を​上げることは​誰にも​できません

Google 検索に​変更を​加えようとする​場合、​厳格な​評価プロセスを​通じて​すべての​可能な​変更を​検討し、​指標を​分析して、​提案された​変更を​実装するか​どうかを​決定します。​こうした​評価や​テストの​データは、​経験豊富な​エンジニアや​検索アナリスト、​法律や​プライバシーの​専門家に​よって​徹底的に​検討され、​変更案が​公開に​値するか​どうかが​判断されます。​2023 年には​ 70 万件以上の​テストを​実施し、​4 千件を​超える​改善を​行いました。

複数の​手段で​検索を​評価。​2023 年の​実績:

4,781 件の​公開

検索に​対する​変更案は、​Google の​経験豊富な​エンジニアや​データ サイエンティストに​よって​一つ​ひとつ​検討されます。​彼らは​あらゆる​テストから​得られた​データを​注意深く​見直して、​その​変更が​公開に​値するか​どうか​判断します。​ユーザーに​とって​実際に​利便性が​高まる​変更である​ことが​明らかでない​限り、​公開に​至る​ことは​ありません。
良い、どちらでもない、悪いと評価された 3 つの変更案

16,871 件の​ライブ トラフィック テスト

Google では​ライブ トラフィック テストも​行っています。​ある​機能を​完全公開する​前に、​実際に​人々が​その機能を​どのように​使うのかを​確認する​ための​テストです。
ユーザー インタラクションの割合を示すグラフによるページの比較
  • 実施中の​テスト

    テスト対象の​機能は、​最初は​ごく​一部の​人々​(通常は​ 0.1%)に​のみ​公開します。​その後、​テスト対象の​グループを、​その​変更を​適用していない​コントロール グループと​比較します。

  • 指標の​分析

    次に、​人々が​何を​クリックしたか、​検索が​何件行われたか、​検索が​放棄されたか、​人々が​検索結果を​クリックするまで​どれくらいの​時間が​かかったかなど、​いくつもの​指標を​調べます。

  • エンゲージメントの​測定

    最後に、​その​結果を​もとに、​新しい​機能に​対する​エンゲージメントが​良好か​どうかを​評価し、​機能の​変更が​すべての​人に​とって​検索結果の​利便性や​関連性の​向上に​つながるように​しています。

719,326 件の​検索品質評価テスト

検索結果の質の高さを示すチェックリストと検索結果のイラスト
Google では、​外部の​検索品質評価者と​協力して、​検索結果の​品質を​継続的に​評価しています。​評価者は、​ウェブサイトの​コンテンツが​検索リクエストを​どの​程度​満たしているかを​評価し、​コンテンツの​専門性、​権威性、​信頼性に​基づいて​検索結果の​品質を​判定します。​これらの​評価が​検索順位に​直接影響する​ことは​ありませんが、​世界中の​人々に​満足していただける​検索結果を​表示する​ための​検索結果​品質の​評価基準と​して​役立てられています。

評価者は、​コンテンツの​専門性、​権威性、​信頼性に​基づいて​検索結果の​品質を​判定します。

常に​一貫した​アプローチが​とれるように、​Google では​検索品質評価ガイドラインを​公開し、​適切な​評価を​行う​ための​指針や​例を​評価者に​提供しています。​検索結果の​質を​評価する​ことは​簡単そうに​聞こえますが、​十分な​検討が​必要となる​場合も​多々​あります。​質の​高い​検索結果を​提供し続ける​ためには、​評価者からの​フィードバックが​不可欠です。

Google 検索の​検索結果の​表示

Google 検索の​検索結果を​人間が​選んだり​並べ替えたりする​ことは​ありません。​Google 検索は、​特定の​クエリに​対して​最も​有益で​信頼性の​高い​コンテンツを​自動的に​表示します。​Google では​ 1 日に​数十億件の​検索が​処理されます。​Google は​自動化に​よって​この​膨大な​数の​検索を​処理しており、​それらの​システムは​さまざまな​要素​(クエリに​含まれている​単語、​ページの​内容、​情報源の​専門性、​ユーザーの​使用言語や​地域など)を​考慮しています。

質の​高い​検索結果を​提供できていない​場所が​見つかった​ときは、​より​幅広い​根本的な​問題の​調査を​行い、​単独の​クエリではなく​多数の​クエリに​対して​検索結果を​改善できるよう、​スケーラブルな​対策を​講じます。

Google は、​Google 検索を​継続的に​改善しています。​対策が​必要と​される​限定的かつ明確に​定義された​状況に​おいて、​人間が​手動で​ポリシー違反の​コンテンツや​違法な​コンテンツを​ブロックする​こともあります。​Google 検索に​適用される​ポリシーに​ついては、 こちら を​ご確認ください。

124,942 件の​比較テスト

検索機能は​絶えず​進化しています。​Google ではより​適切な​検索結果を​返せるように​システムの​改良を​続けており、​その​公開までの​プロセスに​おいて​検索品質の​評価者が​重要な​役割を​担っています。​比較テストでは、​評価担当者に​対して​ 2 つの​異なる​検索結果の​セットを​提示します。​一方は​変更案を​適用した​検索結果、​もう​一方は​適用していない​検索結果です。​そして​ Google が、​どちらの​検索結果が​より​好ましいか、​その​理由も​含めて​尋ねます。
検索品質評価者が 2 種類の検索結果を比較して良い方を選ぶ