Sådan organiserer Google
Søgning oplysninger
Når du søger, gennemser Google flere hundrede milliarder websider og andet indhold, der er lagret i vores søgeindeks, for at finde nyttige oplysninger – flere oplysninger end alle biblioteker i hele verden.
Tre personer, der sorterer oplysninger på kort
Vi finder oplysninger ved hjælp af crawl

Det meste af vores søgeindeks opbygges ved hjælp af software, der kaldes crawlere. Crawlerne ser på offentligt tilgængelige websider og følger links på disse sider, ligesom du ville gøre, hvis du skulle gennemse indhold på internettet. De går fra side til side og lagrer oplysninger om, hvad de finder på disse sider og andet offentligt tilgængeligt indhold i Googles søgeindeks.

Et website med en cykel
Oplysningerne organiseres via indeksering

Når crawlerne finder en webside, gengiver vores systemer indholdet af siden, på samme måde som en browser gør. De noterer vigtige elementer – fra søgeord til opdateringen af websitet – og vi holder styr på det hele i søgeindekset.

Tre samlinger af websites

Googles søgeindeks indeholder flere hundrede milliarder websider og har en størrelse på mere end 100.000.000 gigabytes. Det svarer til indekset til sidst i en bog, men med en note for hvert ord på alle websider, vi indekserer. Når vi indekserer en webside, føjer vi den til posterne for alle de ord, den indeholder.

Konstant crawling efter nye oplysninger

Eftersom nettet og andet indhold konstant ændrer sig, kører vores crawlingprocesser altid for at følge med. Crawlerne lærer, hvor ofte indhold, de har besøgt før, tilsyneladende ændrer sig, og genbesøger det efter behov. De opdager også nyt indhold, når der vises nye links til disse sider eller oplysninger.

Google stiller også en værktøjskasse ved navn Search Console til rådighed uden beregning. Indholdsskabere kan bruge dette værktøj til at hjælpe os med at gennemgå deres indhold på en bedre måde. De kan også gøre brug af etablerede standarder som f.eks. sitemaps eller robots.txt til at indikere, hvor ofte indhold skal besøges, eller om det slet ikke skal inkluderes i vores søgeindeks.

Google tager aldrig imod betaling for at crawle et website oftere – vi stiller de samme værktøjer til rådighed for alle websites for at sikre, at vores brugere får de bedst mulige resultater.

Andet end websider

Vores søgeindeks indeholder mere, end det man kan finde på nettet, fordi der også kan findes nyttige oplysninger via andre kilder.

Faktisk har vi flere indekser med forskellige typer oplysninger, som indsamles gennem crawling, gennem partnerskaber, gennem datafeeds, der sendes til os, og gennem vores egen encyklopædi med fakta, Infokort.

Disse mange indekser betyder, at du kan søge i flere millioner bøger fra store biblioteker, finde afgangstider fra dit lokale offentlige transportselskab eller finde data fra offentlige kilder som f.eks. Verdensbanken.