ゼファーネットのロゴ

「匿名化された」X線データセットは患者の身元を明らかにすることができます

日付:

エンタープライズAIとデータの最も重要なテーマについては、Transform2021に参加してください。 さらに詳しく.


胸部X線は、肺炎からCOPDまでの病気をスクリーニングするために世界中で使用されています。 しかし、それらは臨床ケアにおいて重要な役割を果たしますが、X線の特定の異常を発見することは放射線科医にとって困難な作業になる可能性があります。 これにより、AIを利用した、X線分析による疾患分類システムが生まれました。その一部は有望なパフォーマンスを示しています。 ただし、これらのシステムでは、診断を行うための学習に使用する大量の患者データが必要であり、データが適切に匿名化されていない場合、プライバシーに恐ろしい影響を与える可能性があります。

ドイツのエアランゲンにあるエアランゲン-ニュルンベルク大学の研究者が共同執筆した研究では、X線分類によって患者データが危険にさらされる可能性のある範囲を特定しようとしました。  。 彼らは、112,000を超える胸部X線の公開データセットを利用して、95.55つのX線画像が同じ人物からのものであるかどうかをXNUMX%の精度で識別できる手法(深層学習ベースの再識別モデル)を開発しました。データセットは攻撃に対して脆弱です。

研究者が指摘しているように、匿名化されていると思われる公開されているデータセットには、診断、治療履歴、臨床機関など、患者に関連する機密情報が含まれている可能性があります。 悪意のある攻撃者が既知の人物のX線にアクセスでき、適切に機能する再識別モデルが存在する場合、そのモデルを使用して、特定のX線をX線データセット内の個々の画像と比較できます。 このようにして、データセットに含まれる機密データに人をリンクさせることができます。

共著者は、彼らの技術は、肺の形状の変形など、公開データセット内の同じ人物のXNUMXつの画像間に表示される可能性のある「非剛体」変換に対して堅牢であると述べています。 彼らは、ユニークな患者に特徴的なノイズの多い画像パターンがデータセットに表示され、人々を識別しやすくしていると仮定しています。 しかし、共著者によると、ノイズパターンとアイデンティティの間にほとんど相関関係を示さないデータセットでさえ、妥協する可能性があります。

「再識別は、ChestX-ray14データセットと比較して、データ公開前に他の前処理ステップが実行される可能性のある世界中のさまざまな病院で取得されたデータに適用できます」と研究者は彼らの研究を説明する論文に書いています。 「公に入手可能な医療用胸部X線データは完全に匿名ではないと結論付けています。 ディープラーニングベースの再識別ネットワークを使用すると、攻撃者は特定のX線写真を公開データセットと比較し、アクセス可能なメタデータを対象の画像に関連付けることができます。 したがって、機密性の高い患者データは、関係する患者の意志に反して取得した情報を広める可能性のある攻撃者の許可されていない手に渡るリスクが高くなります。」

胸部X線識別

この種のデータ漏洩では、攻撃者が既知の人物の画像にアクセスする必要があります。 ただし、攻撃者が未知の患者の画像のごく一部しか持っていない場合でも、研究者は、さまざまなデータセットから同じ患者を見つけるために彼らの技術を使用できると述べています。 複数のデータセットに同じ患者が含まれているがメタデータが異なると仮定すると、攻撃者は患者の全体像を取得できる可能性があります。

医療記録違反の頻度が増加していることを考えると、これは非現実的なシナリオではありません。 2017年には、エクスプロイトの27%が 関連する そして、2017年の前半だけで、2019万人以上の患者の記録が 違反した — 2018年の合計15万件のXNUMX倍の違反記録。

「この方法で患者情報を収集することは、攻撃者が患者の本当の身元を推測するのに大いに役立つ可能性があると仮定します」と研究者は書いています。 「したがって、従来の匿名化手法を再検討し、ディープラーニングベースのアルゴリズムによる潜在的な攻撃に抵抗するためのより安全な方法を開発することをお勧めします。」

これらの解決策 課題 ヘルスケアデータでは、必然的に技術、アプローチ、およびパラダイムの組み合わせが必要になります。 データを保護するには、データ損失防止、ポリシーとIDの管理、および暗号化テクノロジーが必要です。これには、組織がデータに影響を与えるアクションを追跡できるようにするテクノロジーも含まれます。 プライバシーの面では、専門家は透明性が最善のポリシーであることに同意しています。個人情報を削除または難読化する匿名化機能は、次のようなプライバシー保護方法と同様に、医療システムの重要な要素です。 差分プライバシー、連合学習、準同型暗号化.

「[フェデレーションラーニング]は、特に患者のプライバシーと個人を特定できる情報の分野で、本当にエキサイティングな研究だと思います」と、SalesforceResearchの医療AI責任者であるAndreEstevaはVentureBeatに以前のインタビューで語りました。 「統合学習には、未開拓の可能性がたくさんあります…[病院]からのデータの物理的な削除を防ぎ、多くの理由で今日アクセスできないAIへのアクセスを提供するために何かを行うことで、さらに別の保護層があります。」

VentureBeatの

VentureBeatの使命は、技術的な意思決定者が革新的なテクノロジーと取引についての知識を習得するためのデジタルタウンスクエアになることです。 私たちのサイトは、あなたが組織を率いるときにあなたを導くためのデータ技術と戦略に関する重要な情報を提供します。 以下にアクセスして、コミュニティのメンバーになることをお勧めします。

  • あなたが興味を持っている主題に関する最新情報
  • ニュースレター
  • ゲート付きのソートリーダーコンテンツと、次のような貴重なイベントへの割引アクセス 変換2021: もっと詳しく知る
  • ネットワーク機能など

会員になる

PrimeXBTをチェックアウト
ACミランの公式CFDパートナーとの取引
ソース:https://venturebeat.com/2021/03/17/anonymized-x-ray-datasets-can-reveal-patient-identities/

スポット画像

最新のインテリジェンス

スポット画像