Jump to Content

วิธีที่ Google Search จัดระเบียบข้อมูล

เมื่อคุณค้นหา Google จะพิจารณาหน้าเว็บหลายแสนล้านหน้าและเนื้อหาดิจิทัลอื่นๆ ที่จัดระเบียบไว้ในดัชนีของ Search เพื่อให้พบข้อมูลที่เป็นประโยชน์ ซึ่งเป็นข้อมูลที่มากกว่าห้องสมุดทั้งหมดในโลก

ภาพคอลลาจของผลการค้นหาซึ่งรวมถึงบทความ วิดีโอ และโฆษณา
ผลการค้นหาที่จัดระเบียบและจัดหมวดหมู่ตามชื่อเรื่อง

ค้นหาข้อมูลจากการ Crawl

ดัชนีของ Search ส่วนใหญ่สร้างขึ้นผ่านผลงานของซอฟต์แวร์ที่เรียกว่า Crawler โปรแกรมเหล่านี้เข้าชมหน้าเว็บที่เข้าถึงได้แบบสาธารณะโดยอัตโนมัติและไปตามลิงก์ในหน้าเหล่านั้น เหมือนเวลาที่คุณเรียกดูเนื้อหาในเว็บ โดยจะเปลี่ยนจากหน้าหนึ่งไปยังอีกหน้าและจัดระเบียบข้อมูลเกี่ยวกับสิ่งที่ค้นพบในหน้าเหล่านี้รวมถึงเนื้อหาอื่นๆ ที่เข้าถึงได้แบบสาธารณะในดัชนีของ Search ของ Google
ภาพแหล่งข้อมูลที่หลากหลายซึ่งดัชนี Search ของ Google ครอบคลุม

จัดเรียงและจัดระเบียบเนื้อหา

เมื่อ Crawler พบหน้าเว็บ ระบบของเราจะแสดงผลเนื้อหาของหน้าในลักษณะเดียวกับที่เบราว์เซอร์ทำ เราจะบันทึกสัญญาณที่สำคัญต่างๆ ไม่ว่าจะเป็นคีย์เวิร์ดหรือความใหม่ของเว็บไซต์ และเราจะติดตามข้อมูลทุกอย่างในดัชนีของ Search

ดัชนีของ Google Search ครอบคลุมหน้าเว็บหลายแสนล้านหน้าและทำงานได้ดีแม้มีขนาดมากกว่า 100,000,000 กิกะไบต์ ดัชนีของเราก็คล้ายๆ กับดัชนีที่อยู่ท้ายหนังสือ ซึ่งทุกคำที่เราพบในทุกหน้าเว็บที่ทำดัชนีจะมีรายการข้อมูลของตัวเอง

Google จะไม่รับเงินจากบุคคลใดที่ขอให้เราทำการ Crawl เว็บใดเว็บหนึ่งให้บ่อยขึ้น เรามอบเครื่องมือเดียวกันให้แก่ทุกเว็บไซต์เพื่อแสดงผลลัพธ์ที่ดีที่สุดต่อผู้ใช้ของเรา

ประมวลผลข้อมูลใหม่อย่างต่อเนื่อง

เนื่องจากเว็บและเนื้อหาอื่นๆ เปลี่ยนแปลงไปอยู่ตลอดเวลา กระบวนการ Crawl ของเราจึงทำงานอยู่เสมอเพื่อตามให้ทัน Crawler จะเรียนรู้ว่าเนื้อหาที่เคยเห็นมาแล้วมีการเปลี่ยนแปลงบ่อยเพียงใดและกลับไปเข้าชมอีกครั้งตามที่จำเป็น และยังค้นพบเนื้อหาใหม่เมื่อมีลิงก์ใหม่ไปยังหน้าเว็บหรือข้อมูลเหล่านั้นปรากฏขึ้น

Google ยังให้บริการชุดเครื่องมือแบบไม่มีค่าใช้จ่ายที่มีชื่อว่า Search Console ซึ่งผู้สร้างเนื้อหาสามารถใช้เพื่อช่วยให้เราทำการ Crawl เนื้อหาของตนได้ดีขึ้นด้วย นอกจากนี้ ผู้สร้างเนื้อหายังใช้ประโยชน์จากมาตรฐานซึ่งเป็นที่ยอมรับ เช่น Sitemap หรือ robots.txt

Google จะไม่รับเงินจากบุคคลใดที่ขอให้เราทำการ Crawl เว็บใดเว็บหนึ่งให้บ่อยขึ้น เรามอบเครื่องมือเดียวกันให้แก่ทุกเว็บไซต์เพื่อแสดงผลลัพธ์ที่ดีที่สุดต่อผู้ใช้ของเรา

ผลการค้นหาที่จัดระเบียบและจัดหมวดหมู่ตามชื่อเรื่อง

จัดทำดัชนีที่มากกว่าหน้าเว็บ

ดัชนีของ Search ครอบคลุมมากกว่าแค่สิ่งที่อยู่ในเว็บ เพราะข้อมูลที่เป็นประโยชน์อาจอยู่ในแหล่งข้อมูลอื่นๆ

อันที่จริง เรามีดัชนีหลายรายการสำหรับข้อมูลประเภทต่างๆ ซึ่งสะสมไว้ผ่านการ Crawl พาร์ทเนอร์ ฟีดข้อมูลที่ส่งให้เรา และสารานุกรมข้อเท็จจริงของเราเองอย่างกราฟความรู้

ดัชนีที่มีอยู่จำนวนมากนี้หมายความว่าคุณสามารถค้นหาภายในหนังสือหลายล้านเล่มจากห้องสมุดชั้นนำ ดูเวลาเดินทางจากบริษัทขนส่งสาธารณะในพื้นที่ หรือหาข้อมูลจากแหล่งที่มาสาธารณะอย่างเช่นธนาคารโลก