Hoe Google data anoniem maak

Anonimisering is 'n dataverwerkingtegniek wat persoonlik-identifiseerbare inligting verwyder of wysig; die gevolg daarvan is geanonimiseerde data wat nie met enige individu geassosieer kan word nie. Dit is ook 'n belangrike komponent van Google se verbintenis tot privaatheid.

Deur geanonimiseerde data te ontleed, kan ons veilige en waardevolle produkte en kenmerke bou, soos die outovoltooi van 'n soeknavraag wat ingevoer word, en kan ons sekuriteitgevare, soos uitvissing- en wanwarewerwe, beter bespeur, terwyl ons gebruikeridentiteite steeds beskerm. Ons kan geanonimiseerde data ook veilig ekstern deel, wat dit vir ander mense nuttig maak sonder om die privaatheid van ons gebruikers te bedreig.

Twee van die tegnieke wat ons gebruik om jou data te beskerm:

Veralgemeen die data

Daar is sekere dataelemente wat makliker met sekere individue verbind kan word. Om daardie individue te beskerm, gebruik ons veralgemening om 'n deel van die data te verwyder of om 'n sekere deel daarvan met 'n algemene waarde te vervang. Byvoorbeeld, ons kan veralgemening gebruik om segmente van alle gebiedskodes of foonnommers met dieselfde reeks nommers te vervang.

Veralemening maak dit vir ons moontlik om k-anonimiteit te behaal – 'n bedryfstandaardterm wat gebruik word om 'n tegniek te beskryf wat die identiteit van individue in 'n groep soortgelyke persone versteek. In k-anonimiteit is die k 'n syfer wat die grootte van 'n groep verteenwoordig. As daar vir enige individu in die datastel minstens k-1 individue is wat dieselfde eienskappe het, het ons k-anonimiteit vir die datastel behaal. Byvoorbeeld, stel jou 'n sekere datastel voor waar k gelyk is aan 50 en die eienskap 'n poskode is. Vir enige persoon in daardie datastel sal daar altyd 49 ander met dieselfde poskode wees. Daarom sal ons geen enkele persoon net met hul poskode kan identifiseer nie.

As alle individue in 'n datastel dieselfde waarde van 'n sensitiewe kenmerk deel, kan sensitiewe inligting bekend gemaak word bloot deur te weet dat hierdie individue deel van die betrokke datastel is. Om hierdie risiko te verklein, kan ons l-diversiteit gebruik – 'n bedryfstandaardterm wat gebruik word om 'n sekere vlak van diversiteit in die sensitiewe waardes te beskryf. Byvoorbeeld, stel jou voor 'n groep mense het almal terselfdertyd 'n soektog na dieselfde sensitiewe gesondheidsonderwerp (byvoorbeeld, griepsimptome) gedoen. As ons hierdie datastel bekyk, sal ons danksy k-anonimiteit nie kan sê wie na die onderwerp gesoek het nie. Daar kan egter steeds 'n privaatheidskwessie wees omdat almal 'n sensitiewe kenmerk (die onderwerp van die navraag) deel. L-diversiteit beteken dat die geanonimiseerde datastel nie net griepsoektogte sal bevat nie. Dit sal eerder ander soektogte saam met die griepsoektogte bevat om gebruikerprivaatheid verder te beskerm.

Voeg geraas by data

Differensiële privaatheid (ook 'n bedryfstandaardterm) beskryf 'n tegniek om wiskundige geraas by data te voeg. Met differensiële privaatheid is dit moeilik om te bepaal of enige individu deel van 'n datastel is omdat die uitset van 'n bepaalde algoritme basies dieselfde sal lyk, ongeag daarvan of enige enkele individu se inligting ingesluit of weggelaat word. Byvoorbeeld, stel jou voor dat ons die oorkoeplende tendens in soektogte na griep in 'n geografiese streek meet. Om differensiële privaatheid te behaal, voeg ons geraas by die datastel. Dit beteken dat ons die aantal mense wat in 'n bepaalde woonbuurt na griep soek, kan bytel of aftrek, maar as ons dit doen, sal dit nie ons meting van die tendens in die groter geografiese streek beïnvloed nie. Dit is ook belangrik om daarop te let dat om geraas by 'n datastel te voeg, dit minder nuttig kan maak.

Anonimisering is net een proses wat ons gebruik om ons verbintenis tot gebruikerprivaatheid na te kom. Ander prosesse sluit in streng kontrole oor gebruikerdatatoegang, beleide om die verbinding van datastelle wat gebruikers kan identifiseer, te beheer en te beperk, en die gesentraliseerde kontrolering van strategieë om geanonimiseerde data te bestuur om 'n konsekwente vlak van beskerming oral op Google te verseker.

Google-programme
Hoofkieslys