Investor's wiki

Anonimizacja danych

Anonimizacja danych

Co to jest anonimizacja danych?

Anonimizacja danych ma na celu ochronę danych prywatnych lub wrażliwych poprzez usuwanie lub szyfrowanie informacji umożliwiających identyfikację osób z bazy danych. Anonimizacja danych odbywa się w celu ochrony prywatnych działań osoby lub firmy przy zachowaniu integralności gromadzonych i udostępnianych danych.

Anonimizacja danych jest również znana jako „zaciemnianie danych”, „maskowanie danych” lub „deidentyfikacja danych”. Można to skontrastować z deanonimizacją,. które są technikami używanymi w eksploracji danych, które mają na celu ponowną identyfikację zaszyfrowanych lub zaciemnionych informacji.

Zrozumienie anonimizacji danych

Korporacje generują, przechowują i przetwarzają ogromne ilości danych wrażliwych w normalnym toku swojej działalności biznesowej. Postęp technologiczny nastąpił dzięki istotnym informacjom zawartym w danych, które zostały wygenerowane i udostępnione w różnych sektorach i krajach. Innowacje finansowe w technologii ( fintech ) poczyniły nieskończone postępy w sposobie dostosowywania usług finansowych do klientów, dzięki danym udostępnionym z sektorów takich jak media społecznościowe i placówki e-commerce.

Dane udostępniane między mediami cyfrowymi a firmami zajmującymi się handlem elektronicznym pomogły obu sektorom lepiej reklamować produkty w swoich witrynach dla określonego użytkownika lub konsumenta. Aby jednak udostępniane dane były przydatne bez narażania tożsamości klientów skompilowanych w bazie danych, należy zastosować anonimizację.

Anonimizacja danych w praktyce

Anonimizacja danych jest przeprowadzana przez większość branż zajmujących się informacjami wrażliwymi, takich jak opieka zdrowotna, finanse i media cyfrowe, przy jednoczesnym promowaniu integralności udostępniania danych. Anonimizacja danych zmniejsza ryzyko niezamierzonego ujawnienia podczas udostępniania danych między krajami, branżami, a nawet działami tej samej firmy. Zmniejsza również możliwość wystąpienia kradzieży tożsamości .

Na przykład szpital udostępniający poufne dane swoich pacjentów medycznemu laboratorium badawczemu lub firmie farmaceutycznej byłby w stanie zrobić to w sposób etyczny, gdyby zachował anonimowość swoich pacjentów. Można to zrobić, usuwając nazwiska, numery ubezpieczenia społecznego, daty urodzenia i adresy pacjentów ze wspólnej listy, pozostawiając ważne elementy wymagane do badań medycznych, takie jak wiek, dolegliwości, wzrost, waga, płeć, rasa itp.

Techniki anonimizacji danych

Anonimizacja danych odbywa się na różne sposoby, w tym usuwanie, szyfrowanie, uogólnianie i wiele innych. Firma może albo usunąć informacje umożliwiające identyfikację osoby (PII) ze zgromadzonych danych, albo zaszyfrować te informacje silnym hasłem. Firma może również zdecydować się na uogólnienie informacji zgromadzonych w swojej bazie danych. Na przykład tabela zawiera dokładny dochód brutto uzyskany przez pięciu dyrektorów generalnych w sektorze detalicznym. Załóżmy, że zarejestrowane dochody wynoszą 520 000 $, 230 000 $, 109 000 $, 875 000 $ i 124 000 $. Informacje te można uogólnić na kategorie, takie jak „< 500 000 USD” i „≥ 500 000 USD”. Chociaż dane są zaciemnione, nadal będą przydatne dla użytkownika.

Rozumowanie anonimizacji danych

Anonimizacja danych polega na oczyszczeniu i zamaskowaniu informacji niejawnych w taki sposób, że w przypadku naruszenia uzyskane dane są bezużyteczne dla sprawców. Potrzeba ochrony danych powinna być traktowana priorytetowo w każdej organizacji, ponieważ informacje niejawne, które wpadną w niepowołane ręce, mogą zostać wykorzystane w niewłaściwy sposób, celowo lub nieumyślnie. Brak wrażliwości podczas obsługi poufnych informacji o klientach może być bardzo kosztowny dla firm, ponieważ organy regulacyjne rozprawiają się z rażącymi zaniedbaniami. Wymogi prawne i dotyczące zgodności, takie jak PCI DSS (Payment Card Industry Data Security Standard), nakładają wysokie kary na instytucje finansowe w przypadku naruszenia karty kredytowej . PIPEDA , kanadyjskie prawo, reguluje ujawnianie i wykorzystywanie danych osobowych przez korporacje .

Dekodowanie zanonimizowanych danych jest możliwe za pomocą procesu znanego jako deanonimizacja (lub „ponowna identyfikacja”). Ze względu na fakt, że zanonimizowane dane można odszyfrować i rozwikłać, krytycy uważają, że anonimizacja zapewnia fałszywe poczucie bezpieczeństwa.

Przegląd najważniejszych wydarzeń

  • Anonimizacja danych odnosi się do usuwania lub szyfrowania informacji osobistych lub identyfikujących z danych wrażliwych.

  • Ponieważ firmy, rządy, systemy opieki zdrowotnej i inne organizacje coraz częściej przechowują informacje o osobach na serwerach lokalnych lub w chmurze, anonimizacja danych ma kluczowe znaczenie dla zachowania integralności danych i zapobiegania naruszeniom bezpieczeństwa.

  • W bardzo wrażliwych sektorach opieki zdrowotnej i finansów dane pacjentów lub klientów muszą być ukrywane w taki sposób, aby spełnić wymogi regulacyjne.