Daugelis Paieškos indeksų sudaromi naudojant programinę įrangą, vadinamą tikrintuvais. Jie automatiškai apsilanko viešai pasiekiamuose tinklalapiuose ir spustelėja tuose puslapiuose pateiktas nuorodas, panašiai kaip jūs naršydami turinį žiniatinklyje. Eidami iš puslapio į puslapį jie išsaugo čia randamą informaciją ir kitą viešai pasiekiamą turinį „Google“ Paieškos indekse.
Paieška sistemina informaciją
Kai paieškos serveriai suranda tinklalapį, sistemos pateikia puslapio turinį taip, kaip naršyklė. Pasižymime pagrindinius signalus (nuo raktinių žodžių iki svetainės naujumo) ir stebime juos visus Paieškos indekse.
„Google“ Paieškos indekse yra labai daug tinklalapių, ir jis užima gerokai daugiau nei 100 000 000 gigabaitų. Tai panašu į indeksą knygos pabaigoje su kiekvieno žodžio, peržiūrėto kiekviename indeksuojamame tinklalapyje, įrašu. Kai indeksuojame tinklalapį, pridedame jį prie visų žodžių, kurie jame yra, įrašų.
Kadangi žiniatinklis ir kitas turinys nuolat keičiasi, mūsų tikrinimo procesai taip pat negali atsilikti. Jie mokosi, kaip dažnai turinys, kurį jie matė anksčiau, keičiasi ir prireikus jį peržiūri. Jie taip pat atranda naujo turinio, nes vis atsiranda naujų nuorodų į tuos puslapius ar informaciją.
„Google“ taip pat teikia be piniginio mokėjimo siūlomą įrankių rinkinį, vadinamą „Search Console“, kuriuo pasinaudoję kūrėjai gali padėti mums geriau patikrinti jų turinį. Jie taip pat gali naudodamiesi nustatytais standartais, pvz., svetainių schemomis arba „robots.txt“, nurodyti, kaip dažnai turinys turėtų būti lankomas arba jei jis apskritai neturėtų būti įtrauktas į Paieškos indeksą.
„Google“ niekada nepriima mokėjimo dėl to, kad svetainė būtų tikrinama dažniau. Visoms svetainėms teikiame tuos pačius įrankius, siekdami užtikrinti geriausius rezultatus naudotojams.
Mūsų Paieškos indeksą sudaro daugiau nei tik tai, kas yra žiniatinklyje, nes naudingos informacijos gali būti ir kituose šaltiniuose.
Tiesą sakant, turime daug indeksų, kuriuose kaupiama įvairių tipų informacija, surinkta tikrinant, bendradarbiaujant, per mums siunčiamus duomenų sklaidos kanalus ir mūsų pačių faktų enciklopediją – Žinių schemą.
Daugybė indeksų reiškia, kad galite ieškoti milijonuose knygų iš pačių didžiausių bibliotekų, rasti kelionių laiką vietinėje viešojo transporto įmonėje ar duomenis iš viešųjų šaltinių, pvz., Pasaulio banko.