プライバシーとデータ保護

はじめに：8,000万人の個人情報が盗まれた日

2014年12月、米国の大手医療保険会社Anthemのデータベースから約8,000万人分の個人情報が流出しました。氏名、生年月日、社会保障番号、医療保険ID、住所、メールアドレス。発覚したのは翌年1月、つまり1ヶ月以上も気づかなかったのです。

Anthemは最終的にHIPAA違反で1,600万ドル（当時過去最高額）の制裁金を科され、集団訴訟の和解金1億1,500万ドル、各州司法長官への制裁金4,820万ドルなど、合計1億7,900万ドル以上を支払いました。

医療データの漏洩は、クレジットカード番号の漏洩とは次元が違います。病歴は変更できません。一度漏れた情報は、保険の拒否、雇用差別、社会的偏見に直結しうるのです。

SourceNEWS

Anthem Pays OCR $16 Million in Record HIPAA Settlement

Anthem事件の制裁金に関する詳報。HIPAA違反として過去最高額

ニュースHIPAA Journal

hipaajournal.com/16-million-anthem-hipaa-breach-settlement-takes-ocr-hipaa-penalties-past-100-million-mark

HIPAA（米国）

HIPAAの3つのルール（プライバシールール・セキュリティルール・違反通知ルール）を横並びに示した図。各ルールの内容とAI開発への影響を記載。 — HIPAAの3ルールはAIを用いた医療データ活用のすべての段階に影響する。

HIPAA (Health Insurance Portability and Accountability Act, 1996年) は、米国における医療情報保護の基盤です。

保護される情報（PHI）

PHI (Protected Health Information) には、以下のように広範な個人識別情報が含まれます:

氏名、住所、電話番号、メールアドレス
社会保障番号、医療記録番号
診断名、治療内容、処方薬
顔写真、指紋、声紋
IPアドレス、デバイスID

HIPAAの3つのルール

ルール	内容	AI開発への影響
プライバシールール	PHIの使用・開示の基準	治療・支払い・医療業務以外での使用には同意が必要
セキュリティルール	ePHIの技術的・物理的・管理的安全対策	暗号化、アクセス制御、監査ログの義務
違反通知ルール	データ侵害時の通知義務	500人以上の侵害は60日以内にHHS・メディアに通知

AI開発におけるHIPAAの実務

PHIをAIモデルの学習に使用する場合:

BAA (Business Associate Agreement) の締結が必須
最小限の使用原則: 目的達成に必要最小限のデータのみ
非識別化: Safe Harbor法（18項目の識別子削除）またはExpert Determination法
暗号化: 保存時・転送時の両方

個人情報保護法（日本）

日本の医療データ分類の階層図。上位から「個人情報」「要配慮個人情報（病歴等）」「匿名加工情報」「仮名加工情報」が段階的に並ぶ。 — 日本法では医療情報の加工レベルにより、第三者提供の可否と利用目的が異なる。

法律の変遷

2003年に制定された個人情報保護法は、2017年と2022年に大幅改正されました。2022年改正では、漏洩時の個人情報保護委員会への報告と本人通知が義務化されています。

SourceDOCUMENTATION

個人情報の保護に関する法律

平成15年法律第57号。2022年改正で漏洩時の報告義務を強化

法令e-Gov法令検索

laws.e-gov.go.jp/law/415AC0000000057

要配慮個人情報

医療情報は要配慮個人情報に該当します。病歴、身体障害、健康診断の結果などは、取得にあたって原則として本人の同意が必要です。

比較

日本とEUの比較

日本: 要配慮個人情報の取得に本人同意が原則必要。ただし、学術研究目的の例外規定あり。

EU (GDPR): 健康データは「特別カテゴリーの個人データ」として、より厳格な処理条件。明示的同意または公衆衛生上の利益が必要。

→ 日本のAI開発者がEU市民のデータを扱う場合、GDPRも同時に遵守する必要がある。

匿名加工情報と仮名加工情報

種別	定義	第三者提供	AI開発での活用
匿名加工情報	個人を識別できず復元もできない	可能（届出必要）	広く共有可能だが、再識別化リスクに注意
仮名加工情報	照合しなければ個人を識別できない	原則不可	内部でのAI学習に適する

次世代医療基盤法

2018年施行の次世代医療基盤法は、匿名加工された医療データを研究目的で活用するための枠組みを定めました。認定事業者が医療機関から個人データを受け取り、匿名加工して研究者に提供します。

Case Study/ 日本

次世代医療基盤法 2024年改正：仮名加工医療情報の新設

改正の背景: 従来の匿名加工医療情報では、希少疾患名や特異な検査値も削除する必要があり、データの有用性が制限されていた。

2024年4月施行の主な変更点:

「仮名加工医療情報」カテゴリの新設: 氏名やID等の削除は必要だが、特異な値や希少疾患名等の削除は不要。匿名加工より詳細なデータを活用可能に
二段階の認定制度: 仮名加工医療情報を作成する事業者と、利用する事業者の双方を国が認定
薬事承認申請への活用: 認定事業者からPMDAへの仮名加工医療情報の提供が可能に。AIを含む医療機器の承認申請でリアルワールドデータを活用できる道が開かれた
再識別・第三者提供の厳格な制限: 仮名加工医療情報の再識別行為は禁止

意義: 匿名加工では失われていたデータの粒度を維持しつつ、プライバシーを保護する「第三の選択肢」。AI医療機器の開発・承認に必要な質の高いデータの活用を後押し。

SourceDOCUMENTATION

次世代医療基盤法（医療ビッグデータ法）

2024年4月改正で「仮名加工医療情報」のカテゴリが新設。薬事申請への活用も可能に

法令Life Data Initiative

ldi.or.jp/en/law

視点

オプトアウト方式の意味

次世代医療基盤法の特徴は、患者のオプトアウト方式を採用している点です。つまり、患者が明示的に拒否しない限り、医療機関は認定事業者にデータを提供できます。研究のためのデータ活用を促進する一方、患者が制度の存在を知らないままデータが使われるリスクも内包しています。

GDPR（EU）

GDPRが患者に付与する4つの権利（アクセス権・削除権・異議申立権・ポータビリティ権）を中心から放射するスポーク図で表した図。 — GDPRは患者に強力な自律的権利を付与し、AI自動処理への異議申立も含まれる。

世界で最も厳格なプライバシー法

GDPR (General Data Protection Regulation, 2018年施行) は、EU域内の個人データを扱うすべての組織に適用されます。組織の所在地に関わらず適用される域外適用が特徴です。

GDPRの主要原則

適法性・公正性・透明性: データ処理の法的根拠が必要
目的の限定: 収集目的以外の使用は原則不可
データの最小化: 必要最小限のデータのみ収集
保存期間の制限: 不要になったデータは削除
説明責任: 遵守の証明義務は組織側にある

個人の権利

GDPRは患者に強力な権利を付与しています:

アクセス権: 自分のデータの使用状況を知る権利
削除権（忘れられる権利）: データの削除を求める権利
異議申立権: AIによる自動化された意思決定に異議を申し立てる権利
データポータビリティ権: データを他のサービスに移行する権利

医療データ侵害への制裁

Case Study/ EU

GDPR医療関連の制裁金事例

GDPRの施行以来、医療分野では237件・合計約2,280万ユーロの制裁金が科されています。

代表的な事例:

ベルギーの病院: ランサムウェア攻撃で約30万人に影響。データ保護影響評価の未実施、セキュリティ研修の不備で20万ユーロの制裁金
スウェーデン Capio St. Göran AB: 患者データの不適切な保護で約290万ユーロ
フランス Dedalus Biologie: 健康データの漏洩で150万ユーロ

GDPRの制裁金は最大2,000万ユーロまたは全世界売上高の4%に達しうる点に注意が必要です。

差分プライバシーの概念をアニメーションで分かりやすく解説。企業がユーザーのプライバシーを保護しながらデータから学習する仕組み（5分）

匿名化技術と再識別化リスク

匿名化の主要技術（識別子削除・一般化・ノイズ付加・k-匿名性）を横一列に並べ、右端に再識別化リスクの矢印が残ることを示す図。 — 匿名化技術は再識別化リスクをゼロにはできないため、差分プライバシー等の追加対策が求められる。

匿名化の主な技術

直接識別子の削除: 氏名、住所、電話番号等の削除
一般化: 「35歳」→「30-40歳」のようにカテゴリに置換
ノイズ付加: データにランダムな変動を加える
k-匿名性: 各個人がk人以上の他者と区別できない状態にする

差分プライバシー

差分プライバシー (Differential Privacy) は、データセットに特定の個人のデータが含まれているかどうかを外部から判別不能にする技術です。AppleやGoogleがユーザーデータの収集に採用しています。

問い

考えてみよう

「完全に匿名化されたデータ」は本当に安全でしょうか？ 2000年代に、Carnegie Mellon大学のLatanya Sweeney教授が「匿名化された」医療データを公開された有権者登録データと突合することで個人を再特定できることを実証しました。

あなたの施設で使用している匿名加工データは、再識別化リスクの評価を受けていますか？

データ侵害への対応

HIPAA・GDPR・個人情報保護法の侵害通知義務を3列で比較した表。各列に通知先と通知期限を記載。 — 三法制の通知期限はそれぞれ異なり、GDPRの72時間が最も厳格である。

各国の通知義務

法制度	通知先	期限
HIPAA	HHS、メディア（500人以上）、患者	60日以内
GDPR	監督機関、影響を受けた個人	72時間以内
個人情報保護法	個人情報保護委員会、本人	速やかに（概ね3-5日以内の速報）

日本の医療機関での事例

Case Study/ 日本

岡山大学病院：フィッシング詐欺による患者情報漏洩

岡山大学病院の医師が、個人のクラウドサービスに患者情報を保存していたところ、フィッシング詐欺によりIDとパスワードを窃取され、269人分の患者情報が第三者にアクセス可能な状態になりました。

問題の本質: 技術的な脆弱性ではなく、院内規定に反して個人クラウドに患者情報を保存するという運用上の問題でした。多くの医療機関のデータ侵害は、高度なハッキングではなく、ヒューマンエラーや規定違反が原因です。

まとめ

医療AIの発展には患者データが不可欠ですが、そのデータは患者の最もプライベートな情報です。Anthem事件は、1回のデータ侵害が1億7,900万ドルの損害と数千万人の不安をもたらすことを示しました。

HIPAA・個人情報保護法・GDPRの3つの法制度は、細部は異なりますが、いずれも「最小限のデータ使用」「適切な安全対策」「侵害時の迅速な通知」を求めている点で共通しています。匿名化技術や差分プライバシーの活用は、プライバシー保護とデータ活用の両立を実現する鍵です。

次のレッスンでは、AIにおけるバイアスと公平性の問題について学びます。

明日のアクション

自施設で使用している電子カルテや医療AIシステムについて、患者データの取り扱いに関する同意書の内容を確認しましょう。「AIによるデータ利用」が明記されているか、匿名化・仮名加工の方法が適切かをチェックし、不足があれば情報管理部門に改善提案を行いましょう。