Google డేటాను ఎలా అనామకంగా చేస్తుంది
అనామకంగా చేయడం అనేది వ్యక్తిగతంగా గుర్తుపట్టగలిగే సమాచారాన్ని తీసివేయగల లేదా సవరించగల డేటా ప్రాసెసింగ్ సాంకేతికత; దీని వలన డేటా ఏ ఒక్క వ్యక్తికి అనుబంధితం కాకుండా అనామకంగా చేయబడుతుంది. అలాగే ఇది గోప్యత పట్ల Google చూపే నిబద్ధతలో కీలక అంశం.
మేము అనామక డేటాను విశ్లేషించడం ద్వారా, నమోదు చేసిన శోధన ప్రశ్నను స్వయంచాలకంగా పూర్తి చేయడం వంటి సురక్షితమైన మరియు విలువైన ఉత్పత్తులు మరియు ఫీచర్లను రూపొందించగలము, అలాగే వినియోగదారు గుర్తింపులను సంరక్షిస్తూనే ఫిషింగ్ మరియు మాల్వేర్ సైట్ల వంటి భద్రతా ప్రమాదాలను మెరుగైన రీతిలో గుర్తించగలము. మా వినియోగదారుల గోప్యతను ప్రమాదంలో పెట్టకుండానే ఇతరులకు ఉపయోగకరంగా ఉండేలా అనామక డేటాను సురక్షితంగా వెలుపల కూడా భాగస్వామ్యం చేయగలము.
మీ డేటాను సంరక్షించడానికి మేము ఉపయోగించే సాంకేతికతలలో రెండు దిగువన అందించబడ్డాయి
డేటాను సాధారణీకరించడం
నిర్దిష్ట వ్యక్తులకు మరింత సులభంగా కనెక్ట్ అయ్యేలా నిర్దిష్ట డేటా మూలకాలు ఉంటాయి. అటువంటి వ్యక్తులను సంరక్షించడం కోసం, మేము డేటాలో కొంత భాగాన్ని తీసివేయడానికి లేదా అందులో కొంత భాగాన్ని సాధారణ విలువతో భర్తీ చేయడానికి సాధారణీకరణను ఉపయోగిస్తాము. ఉదాహరణకు, మేము అన్ని ప్రాంతం కోడ్లు లేదా ఫోన్ నంబర్లను ఒకే వరుసలో వచ్చే సంఖ్యలతో భర్తీ చేయడానికి సాధారణీకరణను ఉపయోగించవచ్చు.
సాధారణీకరణ ప్రక్రియతో మేము k-అనామకత్వాన్ని పొందగలము, ఇది సారూప్య వ్యక్తుల సమూహంలో వారి యొక్క గుర్తింపును దాచడం కోసం ఉపయోగించే సాంకేతికతను వివరించడానికి పరిశ్రమలో వినియోగించే ప్రామాణిక పదం. k-అనామకత్వంలో, k అనేది సమూహ పరిమాణాన్ని సూచించే సంఖ్య. డేటా సమితిలో ఏ వ్యక్తికి అయినా, సారూప్య లక్షణాలు కలిగిన వ్యక్తులు కనీసం k-1 మంది ఉంటే, అప్పుడు మేము డేటా సమితికి k-అనామకత్వాన్ని పొందినట్లు పరిగణించబడుతుంది. ఉదాహరణకు, k విలువగా 50 మరియు లక్షణంగా జిప్ కోడ్తో నిర్దిష్ట డేటా సమితి ఉందనుకోండి. ఆ డేటా సమితిలో ఏ వ్యక్తి కోసమైనా శోధిస్తే, ఒకే జిప్ కోడ్తో మరో 49 మంది ఇతరులు కనిపిస్తారు. కనుక, కేవలం ఒక వ్యక్తి యొక్క జిప్ కోడ్తో వారిని గుర్తించడం మనకు సాధ్యం కాదు.
డేటా సమితిలోని వ్యక్తులందరూ ఒకేలాంటి గోప్యమైన లక్షణం విలువను అందించిన పక్షంలో, అనుమానాస్పద డేటా సమితిలో ఈ వ్యక్తులు భాగంగా ఉన్నారని తెలుసుకోవడం ద్వారా సులభంగా గోప్యమైన సమాచారాన్ని బయటపెట్టవచ్చు. ఈ ప్రమాదాన్ని తగ్గించడానికి, మేము l-భిన్నత్వాన్ని ఉపయోగించవచ్చు, ఇది గోప్యమైన విలువలో కొంత స్థాయి భిన్నత్వాన్ని వివరించడానికి పరిశ్రమలో వినియోగించే ప్రామాణిక పదం. ఉదాహరణకు, కొంత మంది వ్యక్తులందరూ ఒకే గోప్యమైన ఆరోగ్య సంబంధిత అంశం (ఉదా. ఫ్లూ వ్యాధి లక్షణాలు) గురించి ఒకే సమయంలో శోధించారనుకోండి. ఈ డేటా సమితిని గమనించడం ద్వారా ఈ అంశం కోసం ఎవరు శోధించారో చెప్పడం సాధ్యం కాదు, ఇందుకు k-అనామకత్వానికి ధన్యవాదాలు చెప్పుకోవాలి. అయితే, ప్రతి ఒక్కరూ గోప్యమైన లక్షణాన్ని (అనగా. ప్రశ్న అంశం) అందించినందున, ఇప్పటికీ గోప్యతా సమస్య ఉండవచ్చు. L-భిన్నత్వం అనగా అనామక డేటా సమితిలో కేవలం ఫ్లూ సంబంధిత శోధనలు మాత్రమే ఉండవు. వినియోగదారుల గోప్యతను మరింత సంరక్షించడానికి ఫ్లూ సంబంధిత శోధనలతో పాటుగా ఇతర శోధనలు కూడా అందులో చేర్చబడతాయి.
డేటాకు ధ్వనిని జోడించడం
భేదాత్మక గోప్యత (ఇది పరిశ్రమలో వినియోగించే ప్రామాణిక పదం) డేటాకు గణితపరమైన ధ్వనిని జోడించడానికి సంబంధించిన సాంకేతికతను వివరిస్తుంది. భేదాత్మక గోప్యతతో, అందించబడిన అల్గారిథమ్ యొక్క అవుట్పుట్ తప్పనిసరిగా ఒకేలా ఉంటుంది, కాబట్టి నిర్దిష్టంగా ఎవరైనా ఒక వ్యక్తి డేటా సమితిలో భాగంగా ఉన్నారో లేదో నిర్ధారించుకోవడం కష్టం, దీనికి ఆ వ్యక్తి యొక్క సమాచారం చేర్చబడిందా లేదా విస్మరించబడిందా అనేదానితో సంబంధం లేదు. ఉదాహరణకు, ఒక భౌగోళిక ప్రాంతంలో ఫ్లూ సంబంధిత శోధనల సమగ్ర ధోరణిని గణిస్తున్నామనుకోండి. భేదాత్మక గోప్యతను పొందడానికి, మేము డేటా సమితికి ధ్వనిని జోడిస్తాము. అందించిన పరిసరాలలో ఫ్లూ కోసం శోధిస్తున్న వ్యక్తుల సంఖ్యను మేము జోడించవచ్చు లేదా తీసివేయవచ్చు, కానీ అలా చేయడం వలన విస్తృతమైన భౌగోళిక ప్రాంతంలోని ధోరణికి సంబంధించి మా గణనపై ఎలాంటి ప్రభావం ఉండదు. డేటా సమితికి ధ్వనిని జోడించడం వలన అది తక్కువ ఉపయోగకరంగా మారవచ్చని గుర్తుంచుకోవడం కూడా ముఖ్యం.
అనామకంగా చేయడం అనేది వినియోగదారు గోప్యత పట్ల మేము చూపే నిబద్ధతను కొనసాగించడానికి మేము ఉపయోగించే ఒక ప్రాసెస్ మాత్రమే. మిగతా ప్రాసెస్ల్లో వినియోగదారు డేటా యాక్సెస్పై ఖచ్చితమైన నియంత్రణలు, వినియోగదారులను గుర్తించే అవకాశం ఉండే డేటా సమితులలో చేరడాన్ని నియంత్రించే మరియు పరిమితం చేసే విధానాలు, అలాగే Google అంతటా స్థిరమైన స్థాయిలో సంరక్షణను అందించడం కోసం అనామకంగా చేసే ప్రక్రియపై కేంద్రీకృత సమీక్ష మరియు డేటా నిర్వహణ వ్యూహాలు ఉంటాయి.