Jump to ​Content

透過​嚴謹​的​測試​改進​搜尋​服務

Google ​的​目標​是​持續​為​使用​者​提供​最​實用且​相關​的​資訊。​我們​對​搜尋​服務​所​做​的​調整,​都​是​為了​向​使用​者​呈現​更​實用​的​搜尋​結果。

世界地圖的插圖,每個洲都釘有不同使用者的顯示圖片。

瞭解​評​分者​如何​提升​ Google​ ​搜尋​的​服務​品質

實用性測試

為了​滿足​ ​Google ​使用​者​不斷​演變​的​需求​與​期望,​搜尋​服務​多​年​來​也​與​時俱進,​除了​提供知識圖​譜等​創新​服務,​我們​也​不斷​更​新​系統,​確保​持續​優先​顯示​具​關​聯性​的​內容。​目標始終​如​一,​那就是​提升​搜尋​結果​的​實用性。​因此,​雖然​廣告​主可以​付費​將​宣傳​內容​刊登​在​顯眼​的​廣告​區段,​但沒有​人​可以​在​搜尋​結果​中​買到​較佳​的​刊登​位置

我們​對​ Google​ 搜尋​提出​的​變更​提案,​全​都​會​經過​嚴謹​評估,​並​在​指標​分析​完成​後​決定​是否​實施。​搜尋​評估​和​實驗​的​資料​會​由​經驗​豐富​的​工程師​和​搜尋​分析師​仔​細​審核,​其他​法律​和​隱私權​專家​也​會​在​後續​決定​變​更​可​行性。​我們​ 202​3 年​執行​了​ 7​00,000 ​多​項​實驗,​最終​為​ Google​ ​搜尋​推出​超過​ 4,000​ ​項​改進​措施。

Google 會​以​多​種​方式​評估​搜尋​服務​品質。​以下​是​ 202​3 年​採取​的​行動:

推出​ 4,781​ ​項​變​更

Google ​對​搜尋​服務​提出​的​每​一​項​變更​提案,​都​必須​由​自家​經驗​最​豐富​的​工程師​和​數據​資料​學​家​審核。​他們​會​在​謹慎​審視​從​不同​實驗​中​取得​的​資料​後,​決定​是否​實施​變更。​如果​無法​確實​為​使用​者​提供​更好​的​搜尋​體驗,​我們​絕​不會​輕易​推出​變​更​項目。
三項變更提案,分別被評為佳、普通和不佳

16,871​ ​次​即時​流量​實驗

全面​推出​某​項​功​能​前,​我們​會​進行​即時​流量​實驗,​預先​瞭解​使用​者​的​實際​操作​情形。
兩個頁面版本的比較,搭配呈現使用者互動率的圖表
  • 執行​實驗

    首先,​我們​會​向​少數​使用​者​ ​(通常​從​ 0.1%​ 開始)​ 開放​測試​功能,​然後​將​實驗組​與​未啟用​測試​功​能​的​控制組​對照。

  • 分析​指標

    接​下來,​我們​會​分析​一長​串​指標,​包括​使用​者​點選​的​內容、​執行​查詢​的​次數、​是否​放​棄​查詢、​使用​者​從​看見​到​點選搜尋​結果​所​經過​的​時間​等。

  • 衡量​使用​者​參與​度

    最後,​我們​會​根據​實驗​結果​衡量​使用​新功能​是否​帶來​正面​影響,​確保​實施​變​更​後,​能​為​所有​使用​者​提供​關聯性​和​實用性​更​高​的​搜尋​結果。

719,326​ ​次​搜尋​品質​測試

搜尋結果的插圖,旁邊的檢查清單表示符合優質結果的條件
為了​衡量​搜尋​結果​的​品質,​我們​一向​與​外部​的​搜尋​品質​評分​者​合作。​評分​者會​評估​網站​內容​符合​搜尋​要求​的​程度,​並​根據​內容​專業性、​權威性​和​可​信度​衡量​搜尋​結果​品質。​這些​評分​不會​直接​影響​排名,​但​可​做​為​衡量​搜尋​結果​品質​的​依據,​並​確保​全球​使用​者​都​能​享​有​優質​的​搜尋​體驗。

評分者會​根據​內容​專業性、​權威性​和​可​信度​衡量​搜尋​結果​品質。

為了​維持​評分​標準​的​一​致性,​我們​發布​了​《搜​尋品質​評​分者​指南》,​向​評分者​舉例​說明​如何為​網站​妥善​評分。​衡量​搜尋​結果​品質​看似​容易,​但​仍​有​許多​棘手​的​情形​需要​謹慎​考量,​因此​評​分者​的​意見​回饋​至​關​重要,​可確​保​我們​持續​為​使用​者​提供​優質​的​搜尋​結果。

顯示​ Google​ 搜尋​結果

Google​ ​搜尋會​自動​針對​特定​查詢字詞​顯示​最​實用​可靠​的​內容,​使用​者​無法​自行​選擇​或​排列​搜尋​結果。​Google ​每​天​都​會​處理數​十億次​的​搜尋​要求,​規模​如​此​龐大​的​作業,​必須​仰賴​自動化​機制​才​能​完成。​系統​會​考量​多​項​因素,​包括​你​的​查詢​字詞、​網頁​內容、​資訊​來源​的​專業​度,​以及​使用​的​語言​和​所​在​位置。

一旦​發現​搜尋​結果​品質​不佳,​我們​會​從​更​廣泛​的​角度​釐清​問題,​並​採取​可彈性​擴充​的​做法,​針對​所有​類​似​查詢​提升​搜尋​結果​品質。

我們​致力​不斷​改進​ ​Google​ ​搜尋,​在​某些​情況​下,​可能​會​以​人力​封鎖​違反​政策​或​非法​的​內容。​不過,​這​類​情況​其​實​相當​少見,​而且​都​有​明確​定​義。​歡迎​按 這​裡 進一步​瞭解​ Google​ 搜尋​適用​的​政策。

124,942​ 次​對​照​實驗

Google​ ​搜尋​並​非​一​成​不變,​為了​傳回​更​實用​的​搜尋​結果,​我們​不斷​推出​變​更​項目​來​改進​系統,​過程​中搜​尋品質​評分​者​扮演​著​重要​角色。​在​對​照​實驗​中,​我們​會​向​評分者​展示​兩​組​不同​的​搜尋​結果,​分別​呈現​實施​變​更​提案​前後​的​情況,​然​後​請​他們​選出​偏好​的​一組​並​說明​原因。
搜尋品質評分者比較兩組搜尋結果,並挑選較好的一組