Avanonymisering
Hva er avanonymisering?
De-anonymisering er en teknikk som brukes i datautvinning som forsøker å re-identifisere kryptert eller skjult informasjon. De-anonymisering, også referert til som re-identifikasjon av data, kryssreferanser anonymisert informasjon med andre tilgjengelige data for å identifisere en person, gruppe eller transaksjon.
Forstå de-anonymisering
Den teknologikyndige epoken forstyrrer raskt den tradisjonelle måten å gjøre ting på på tvers av ulike sektorer av økonomien. De siste årene har finansnæringen sett mange digitale produkter introdusert til sin sektor av fintech- selskaper. Disse innovative produktene har fremmet finansiell inkludering der flere forbrukere har tilgang til finansielle produkter og tjenester til en lavere kostnad enn tradisjonelle finansinstitusjoner tillater. Økningen i implementeringen av teknologi har ført til en økning i innsamling, lagring og bruk av data.
Teknologiverktøy som sosiale medieplattformer, digitale betalingsplattformer og smarttelefonteknologi har avduket massevis av data som brukes av ulike selskaper for å forbedre deres interaksjon med forbrukere. Dette tonnevis av data kalles big data,. og er en grunn til bekymring blant enkeltpersoner og regulatoriske myndigheter som krever flere lover som beskytter brukernes identitet og personvern.
Hvordan de-anonymisering fungerer
I en tid med big data hvor sensitiv informasjon om en brukers aktiviteter på nettet deles øyeblikkelig gjennom cloud computing, har dataanonymiseringsverktøy blitt brukt for å beskytte brukernes identitet. Anonymisering maskerer personlig identifiserbar informasjon (PII) til brukere som utfører transaksjoner på ulike områder som helsetjenester, sosiale medieplattformer, e-handel, osv. PII inkluderer informasjon som fødselsdato, personnummer (SSN), postnummer og IP adresse. Behovet for å maskere de digitale sporene etterlatt av nettaktiviteter har ført til implementering av anonymiseringsstrategier som kryptering, sletting, generalisering og forstyrrelse. Selv om dataforskere bruker disse strategiene for å skille sensitiv informasjon fra de delte dataene, bevarer de fortsatt den opprinnelige informasjonen, og åpner dermed dører for muligheten for re-identifikasjon.
Avanonymisering reverserer prosessen med anonymisering ved å matche delte, men begrensede datasett med datasett som er lett tilgjengelige på nettet. Data miners kan deretter hente noe informasjon fra hvert tilgjengelig datasett for å sette sammen en persons identitet eller transaksjon. For eksempel kan en dataminer hente et datasett som deles av et telekommunikasjonsselskap, et nettsted for sosiale medier, en e-handelsplattform og et offentlig tilgjengelig folketellingsresultat for å bestemme navnet og hyppige aktiviteter til en bruker.
Hvordan de-anonymisering brukes
Re-identifikasjon kan være vellykket når ny informasjon frigis eller når anonymiseringsstrategien som er implementert, ikke blir utført på riktig måte. Med en enorm tilgang på data og begrenset mengde tid tilgjengelig per dag, implementerer dataanalytikere og gruvearbeidere snarveier kjent som heuristikk for å ta beslutninger. Mens heuristikk sparer verdifull tid og ressurser ved å kjemme gjennom et datasett, kan det også skape hull som kan utnyttes hvis feil heuristisk verktøy ble implementert. Disse hullene kan identifiseres av dataminere som søker å avanonymisere et datasett for enten lovlige eller ulovlige formål.
Personlig identifiserbar informasjon hentet ulovlig fra de-anonymiseringsteknikker kan selges på underjordiske markedsplasser, som også er en form for anonymiseringsplattformer. Informasjon som faller i feil hender kan brukes til tvang, utpressing og trusler som fører til personvernhensyn og enorme kostnader for virksomheter som blir ofre.
Avanonymisering kan også brukes lovlig. For eksempel ble Silk Road - nettstedet, en underjordisk markedsplass for ulovlige stoffer, hostet av et anonymisert nettverk kalt Tor,. som bruker en løkstrategi for å skjule IP-adressene til brukerne. Tor-nettverket er også vert for et par andre ulovlige markeder som handler med våpen, stjålne kredittkort og sensitiv bedriftsinformasjon. Med bruk av komplekse de-anonymiseringsverktøy klarte FBI å knekke og stenge Silk Road og nettsteder som driver med barnepornografi .
Suksess med re-identifikasjonsprosesser har bevist at anonymitet ikke er garantert. Selv om banebrytende anonymiseringsverktøy ble implementert i dag for å maskere data, kan dataene identifiseres på nytt i løpet av et par år ettersom ny teknologi og nye datasett blir tilgjengelige.
Høydepunkter
– Anonymiserte data brukes allestedsnærværende i nettbaserte og finansielle transaksjoner, samt på sosiale medier og andre former for elektronisk meldingsutsendelse og kommunikasjon.
– Å gjenidentifisere anonymiserte data kan kompromittere personlig identitet og økonomisk sikkerhet for ulovlige formål, samt undergrave forbrukernes tillit.
– De-anonymisering er praksisen med å rekonstituere den private informasjonen som er lagret i krypterte eller på annen måte skjulte data.