Jump to Content

Cách Google Tìm kiếm hệ thống hoá thông tin

Khi bạn tìm kiếm, Google sẽ tìm khắp hàng trăm tỷ trang web và các nội dung kỹ thuật số khác trong chỉ mục của Tìm kiếm để tìm ra thông tin hữu ích – nhiều thông tin hơn tất cả thư viện trên thế giới cộng lại.

Một ảnh ghép các kết quả tìm kiếm bao gồm bài viết, video và quảng cáo
Kết quả tìm kiếm được hệ thống hoá và phân loại theo chủ đề

Tìm thông tin bằng cách thu thập thông tin

Đa phần chỉ mục của Tìm kiếm được xây dựng nhờ loại phần mềm gọi là trình thu thập thông tin. Trình thu thập thông tin tự động truy cập các trang web công khai và đi theo những đường liên kết trên các trang đó, tương tự như khi bạn duyệt xem nội dung trên web. Trình thu thập thông tin sẽ đi từ trang này sang trang khác và hệ thống những thông tin tìm thấy được trên các trang này cũng như các nội dung công khai khác trong chỉ mục của Google Tìm kiếm.
Hình minh hoạ sự đa dạng của các nguồn theo chỉ mục của Tìm kiếm của Google

Sắp xếp và hệ thống hoá nội dung

Khi trình thu thập thông tin tìm thấy một trang web, hệ thống của chúng tôi sẽ hiển thị nội dung của trang đó, tương tự như cách hoạt động của trình duyệt. Chúng tôi ghi lại các tín hiệu chính – từ từ khoá cho đến độ mới của trang web – và theo dõi tất cả trong chỉ mục của Tìm kiếm.

Chỉ mục của Google Tìm kiếm bao gồm hàng trăm tỷ trang web và có kích thước lên tới hơn 100.000.000 gigabyte. Chỉ mục này cũng giống như mục lục ở cuối một cuốn sách, trong đó mỗi mục chứa một từ có trên trang web được lập chỉ mục.

Google không bao giờ nhận tiền để thu thập thông tin một trang web thường xuyên hơn — chúng tôi cung cấp các công cụ giống nhau cho tất cả trang web để đảm bảo mang lại kết quả tốt nhất có thể cho người dùng của mình.

Liên tục xử lý thông tin mới

Vì Internet và các nội dung khác không ngừng thay đổi nên quy trình thu thập thông tin của chúng tôi luôn phải cố gắng bắt kịp. Những quy trình này tìm ra tần suất thay đổi của những nội dung từng thấy trước đó và truy cập lại khi cần. Những quy trình này cũng khám phá ra nội dung mới khi có đường liên kết hay thông tin mới xuất hiện trên những trang đó.

Google cũng cung cấp bộ công cụ miễn phí có tên Search Console mà nhà sáng tạo có thể sử dụng để giúp chúng tôi thu thập thông tin về nội dung của họ hiệu quả hơn. Nhà sáng tạo cũng có thể sử dụng các tiêu chuẩn uy tín như sơ đồ trang web hoặc tệp robots.txt.

Google không bao giờ nhận tiền để thu thập thông tin một trang web thường xuyên hơn — chúng tôi cung cấp các công cụ giống nhau cho tất cả trang web để đảm bảo mang lại kết quả tốt nhất có thể cho người dùng của mình.

Kết quả tìm kiếm được hệ thống hoá và phân loại theo chủ đề

Lập chỉ mục không chỉ trang web

Chỉ mục của Tìm kiếm không chỉ bao gồm nội dung có trên web vì thông tin hữu ích có thể được tìm thấy trong các nguồn khác.

Trên thực tế, chúng tôi có nhiều chỉ mục về các loại thông tin khác nhau, được thu thập thông qua quá trình thu thập thông tin, quan hệ đối tác, các nguồn cấp dữ liệu được gửi cho chúng tôi và bách khoa toàn thư dữ kiện của riêng chúng tôi, Sơ đồ tri thức.

Nhiều chỉ mục như vậy đồng nghĩa với việc bạn có thể tìm kiếm trong hàng triệu cuốn sách từ các thư viện lớn, tìm thời gian di chuyển từ công ty vận tải công cộng tại địa phương, hoặc tìm dữ liệu từ các nguồn công khai như Ngân hàng Thế giới.