データの匿名化

##データの匿名化とは何ですか？

、データベースから個人を特定できる情報を削除または暗号化することにより、個人データまたは機密データを保護しようとします。データの匿名化は、収集および共有されるデータの整合性を維持しながら、個人または企業の個人的な活動を保護する目的で行われます。

データの匿名化は、「データの難読化」、「データのマスキング」、または「データの匿名化」とも呼ばれます。これは、暗号化された情報や隠された情報を再識別しようとするデータマイニングで使用される手法である匿名化とは対照的です。

##データの匿名化について

企業は、通常の業務の過程で膨大な量の機密データを生成、保存、および処理します。さまざまなセクターや国で生成および共有されたデータに関連情報が含まれているため、テクノロジーの進歩が盛んになっています。テクノロジーの金融革新（ fintech ）は、ソーシャルメディアや電子商取引施設などのセクターから共有されたデータのおかげで、金融サービスをクライアントに合わせてカスタマイズする方法で無限の進歩を遂げました。

デジタルメディアとeコマース企業の間で共有されるデータは、両方のセクターが特定のユーザーまたは消費者にサイト上の製品をより適切に宣伝するのに役立ちました。ただし、データベースにコンパイルされたクライアントのIDを損なうことなく共有データを使用するには、匿名化を利用する必要があります。

##実際のデータの匿名化

データの匿名化は、データ共有の整合性を促進しながら、ヘルスケア、金融、デジタルメディア業界などの機密情報を扱うほとんどの業界で実行されます。データの匿名化により、国、業界、さらには同じ企業内の部門間でデータを共有する際の意図しない開示のリスクが軽減されます。また、盗難を特定する機会が減ります。

たとえば、患者の機密データを医療研究所や製薬会社と共有している病院は、患者を匿名にしておけば倫理的にそうすることができます。これは、年齢、病気、身長、体重、性別、人種などの医学研究に必要な重要な要素を残したまま、共有リストから患者の名前、社会保障番号、生年月日、住所を削除することで実行できます。

##データの匿名化手法

データの匿名化は、削除、暗号化、一般化、およびその他のホストを含むさまざまな方法で行われます。企業は、収集したデータから個人を特定できる情報（PII）を削除するか、この情報を強力なパスフレーズで暗号化することができます。企業は、データベースに収集された情報を一般化することも決定できます。たとえば、表には、小売部門の5人のCEOが獲得した正確な総収入が含まれています。記録された収入が$520,000、$ 230,000、$ 109,000、$ 875,000、および$124,000であると仮定しましょう。この情報は、「<$500,000」や「≥$500,000」などのカテゴリに一般化できます。データは難読化されていますが、それでもユーザーにとっては有用です。

##データの匿名化の推論

データの匿名化とは、分類された情報をサニタイズおよびマスクして、違反が発生した場合に取得したデータが犯人に役に立たないようにすることです。悪用された分類された情報は、意図的または意図せずに悪用される可能性があるため、データを保護する必要性は、すべての組織で優先度を高くする必要があります。規制当局が重大な過失を取り締まるため、機密性の高いクライアント情報を処理する際の機密性の欠如は、企業に多大なコストをかける可能性があります。 PCI DSS（Payment Card Industry Data Security Standard）のような法的要件およびコンプライアンス要件は、クレジットカード違反が発生した場合に、金融機関に多額の罰金を課します。カナダの法律であるPIPEDAは、企業による個人情報の開示と使用を規定しています。組織による個人データの使用または誤用を監視するために設立された他の複数の規制機関があります。

匿名化されたデータのデコードは、匿名化解除（または「再識別」）と呼ばれるプロセスを通じて可能になります。匿名化されたデータはデコードして解明できるため、批評家は匿名化が誤った安心感をもたらすと信じています。

##ハイライト

-データの匿名化とは、機密データから個人情報または識別情報を削除または暗号化することです。

-企業、政府、ヘルスケアシステム、およびその他の組織が個人の情報をローカルサーバーまたはクラウドサーバーに保存することが増えているため、データの整合性を維持し、セキュリティ違反を防ぐには、データの匿名化が不可欠です。

-機密性の高いヘルスケアおよび金融セクターでは、規制要件を満たすような方法で患者または顧客のデータを隠す必要があります。