Investor's wiki

非匿名化

非匿名化

##匿名化解除とは何ですか?

匿名化解除は、データマイニングで使用される手法であり、暗号化された情報や隠された情報を再識別しようとします。匿名化解除は、データの再識別とも呼ばれ、匿名化された情報を他の利用可能なデータと相互参照して、個人、グループ、またはトランザクションを識別します。

##匿名化解除を理解する

テクノロジーに精通した時代は、経済のさまざまなセクターで物事を行う従来の方法を急速に崩壊させています。近年、金融業界では、フィンテック企業によって多くのデジタル製品がそのセクターに導入されています。これらの革新的な製品は金融包摂を促進し、従来の金融機関が許可するよりも低コストでより多くの消費者が金融商品やサービスにアクセスできるようになりました。テクノロジーの実装の増加により、データの収集、保存、および使用が増加しました。

ソーシャルメディアプラットフォーム、デジタル決済プラットフォーム、スマートフォンテクノロジーなどのテクノロジーツールは、さまざまな企業が消費者とのやり取りを強化するために使用する大量のデータを明らかにしました。この大量のデータはビッグデータと呼ばれ、ユーザーの身元とプライバシーを保護するためのより多くの法律を求める個人や規制当局の間で懸念の原因となっています。

##匿名化解除の仕組み

ユーザーのオンライン活動に関する機密情報がクラウドコンピューティングを通じて瞬時に共有されるビッグデータの時代では、データ匿名化ツールがユーザーのIDを保護するために採用されてきました。匿名化は、医療サービス、ソーシャルメディアプラットフォーム、eコマーストレードなどのさまざまな分野で取引するユーザーの個人識別情報(PII)をマスクします。PIIには、生年月日、社会保障番号(SSN)、郵便番号、IPなどの情報が含まれます。住所。オンライン活動によって残されたデジタル証跡を隠す必要性は、暗号化、削除、一般化、摂動などの匿名化戦略の実装につながりました。データサイエンティストはこれらの戦略を使用して共有データから機密情報を切り離しますが、それでも元の情報を保持するため、再識別の可能性への扉が開かれます。

匿名化解除は、共有されているが限定されたデータセットをオンラインで簡単にアクセスできるデータセットと照合することにより、匿名化のプロセスを逆転させます。データマイナーは、利用可能な各データセットからいくつかの情報を取得して、個人のIDまたはトランザクションをまとめることができます。たとえば、データマイナーは、通信会社、ソーシャルメディアサイト、eコマースプラットフォーム、および公開されている国勢調査の結果によって共有されるデータセットを取得して、ユーザーの名前と頻繁なアクティビティを判別できます。

##匿名化解除の使用方法

新しい情報がリリースされた場合、または実装された匿名化戦略が適切に行われていない場合、再識別は成功する可能性があります。膨大な量のデータと1日あたりの利用可能な時間が限られているため、データアナリストとマイナーは、決定を下す際にヒューリスティックと呼ばれるショートカットを実装しています。ヒューリスティックは、データセットを組み合わせる際に貴重な時間とリソースを節約しますが、間違ったヒューリスティックツールが実装された場合に利用できるギャップを作成する可能性もあります。これらのギャップは、合法または違法の目的でデータセットの匿名化を解除しようとしているデータマイナーによって特定される可能性があります。

匿名化解除技術から違法に取得された個人を特定できる情報は、匿名化プラットフォームの一種でもある地下市場で販売することができます。悪意のある人の手に渡った情報は、強要、強奪、脅迫に使用される可能性があり、被害者となる企業にとってプライバシーの懸念と莫大な費用につながります。

匿名化解除も合法的に使用できます。たとえば、違法薬物の地下市場であるSilk Road Webサイトは、タマネギ戦略を使用してユーザーのIPアドレスを難読化するTorと呼ばれる匿名化されたネットワークによってホストされていました。 Torネットワークは、銃、盗まれたクレジットカード、機密性の高い企業情報を取引する他のいくつかの違法な市場もホストしています。複雑な匿名化解除ツールを使用することで、FBIはSilkRoadと子供ポルノに従事しているサイトを正常にクラックしてシャットダウンしました。

再識別プロセスの成功は、匿名性が保証されていないことを証明しています。データをマスクするために画期的な匿名化ツールが今日実装されたとしても、新しいテクノロジーと新しいデータセットが利用可能になると、データは数年以内に再識別される可能性があります。

##ハイライト

-匿名化されたデータは、オンラインや金融取引、ソーシャルメディア、その他の形式の電子メッセージングや通信で広く使用されています。

-匿名化されたデータを再識別すると、違法な目的で個人の身元と財務上のセキュリティが損なわれるだけでなく、消費者の信頼が損なわれる可能性があります。

-匿名化とは、暗号化されたデータやその他の方法で隠されたデータに保存されている個人情報を再構成することです。