Investor's wiki

去匿名化

去匿名化

什么是去匿名化?

去匿名化是一种用于数据挖掘的技术,它试图重新识别加密或模糊的信息。去匿名化,也称为数据重新识别,将匿名信息与其他可用数据交叉引用,以识别个人、群体或交易。

了解去匿名化

精通技术的时代正在迅速颠覆各个经济部门的传统做事方式。近年来,金融行业已经看到许多金融科技公司将数字产品引入其行业。这些创新产品促进了金融包容性,让更多消费者能够以比传统金融机构更低的成本获得金融产品和服务。技术实施的兴起带来了数据收集、存储和使用的增加。

社交媒体平台、数字支付平台和智能手机技术等技术工具揭示了各种公司用来加强与消费者互动的大量数据。大量数据被称为大数据,引起了个人和监管机构的关注,他们呼吁制定更多保护用户身份和隐私的法律。

去匿名化的工作原理

在大数据时代,用户在线活动的敏感信息通过云计算即时共享,数据匿名化工具被用来保护用户的身份。匿名化掩盖了在医疗服务、社交媒体平台、电子商务交易等各个领域进行交易的用户的个人身份信息 (PII)。PII 包括出生日期、社会安全号码 (SSN)、邮政编码和 IP 等信息地址。掩盖在线活动留下的数字痕迹的需要导致了匿名化策略的实施,例如加密、删除、泛化和扰动。尽管数据科学家使用这些策略从共享数据中分离出敏感信息,但它们仍然保留了原始信息,从而为重新识别的可能性打开了大门。

去匿名化通过将共享但有限的数据集与易于在线访问的数据集相匹配来逆转匿名化过程。然后,数据挖掘者可以从每个可用数据集中检索一些信息,以将一个人的身份或交易组合在一起。例如,数据挖掘者可以检索电信公司、社交媒体网站、电子商务平台和公开的人口普查结果共享的数据集,以确定用户的姓名和频繁活动。

如何使用去匿名化

当新信息发布或实施的匿名化策略未正确执行时,重新识别可能会成功。由于每天有大量数据和有限的可用时间,数据分析师和矿工正在实施称为启发式决策的捷径。虽然启发式方法在梳理数据集时节省了宝贵的时间和资源,但如果实施了错误的启发式工具,它也可能造成可以利用的空白。出于合法或非法目的,寻求对数据集进行去匿名化的数据挖掘者可以识别这些差距。

通过去匿名化技术非法获得的个人身份信息可以在地下市场出售,这也是一种匿名化平台。落入坏人之手的信息可被用于胁迫、勒索和恐吓,从而导致隐私问题和成为受害者的企业的巨额成本。

去匿名化也可以合法使用。例如,丝绸之路网站是一个非法毒品的地下市场,由一个名为Tor的匿名网络托管,该网络使用洋葱策略来混淆其用户的 IP 地址。 Tor 网络还托管着其他几个非法交易枪支、被盗信用卡和敏感公司信息的市场。通过使用复杂的去匿名化工具,FBI 成功破解并关闭了丝绸之路和从事儿童色情活动的网站。

重新识别过程的成功证明不能保证匿名性。即使今天实施了突破性的匿名化工具来掩盖数据,随着新技术和新数据集的出现,数据也可能在几年内被重新识别。

## 强调

  • 匿名数据广泛用于在线和金融交易,以及社交媒体和其他形式的电子信息和通信。

  • 重新识别匿名数据可能会因非法目的而危及个人身份和财务安全,并破坏消费者的信任。

  • 去匿名化是重构存储在加密或其他模糊数据中的私人信息的做法。