• Column
  • DXの核をなすデータの価値を最大限に引き出す

データ活用サイクル・ステップ3:データが出す価値【第5回】

佐藤 恵一(日立製作所 公共システム事業部 パブリックセーフティ推進本部)
2024年6月13日

個人情報の保護では「仮名化」と「暗号化」が重要

(2)蓄積段階での取り組み

 疾患レジストリは要配慮個人情報を取り扱うため、特に個人情報保護に配慮しなければなりません。そこでは、第3回で説明した「仮名化」と、第4回で説明した「暗号化」が重要になります。

 図1の例では、患者の氏名や生年月日といった個人を特定できる情報は、ランダムな数列である乱数と等価な暗号文により「乱数化」し、秘匿・管理します。データと暗復号鍵を分離し、医師などの限られた利用者にのみ、それぞれに異なる暗復号鍵を配布することで、高いセキュリティを確保します。それ以外の情報は、個人を特定できる情報を除いた形に「仮名化」し、分離・管理します。

 個人情報保護法は、仮名加工情報に関連して、個人情報から削除された記述などを「削除情報等」と定義しています。本例では、氏名などの個人を特定できる情報が該当します。

 仮名加工情報を作成する際は、後で復元できるよう「仮ID」を付して作成する場合があります。このとき、氏名などと仮IDの対応を示す「対応表」が生成されます。この対応表も削除情報等に含まれます。本例では、暗復号鍵が対応表に相当します。削除情報等は厳重に管理されることが要求されているため、暗復号鍵の管理が重要になります。

 仮IDは、乱数化などの規則性を有しない方法で生成されなければなりません。本例では、第4回で説明した秘密計算技術を用いて乱数化処理を行っています。特に、秘密計算技術の一種である検索可能暗号を採用することで、医師が患者の情報を検索できるようになり、利便性と高いセキュリティとの両立を図っています。

 さらに、アクセス権の設定などにより、取り扱えるデータを必要最小限にする施策も重要です。これらにより、GDPR(General Data Protection Regulation:EU一般データ保護法)や個人情報保護法、人を対象にした生命科学・医学系研究に関する倫理指針などのガイドラインなどを遵守した取り組みが実現できるのです。

 なお、データの価値を高める手段に個人との「紐づけ」があります。しかし、患者の情報は医療機関ごとに別々に管理・蓄積されているのが一般的です(図2の左)。それぞれの医療機関がデータを別々に加工するため、医療機関が異なると同一人物のデータをつなげられず、別人のデータとして取り扱われてしまいます。

図2:患者の情報は現状、医療機関単位に管理されているのが一般的

 このような課題に対し、異なる医療機関のデータを個人に紐づけて統合する処理を「名寄せ」と言います。今までバラバラになっていたデータが「紐づく」ことでデータの精度が向上します。特に、世の中に存在するデータが少ない希少疾患などの分野では顕著になります。

 疾患レジストリでは、氏名や生年月日などの個人を特定できる情報を一元管理することで、異なる病院のデータでも同一人物に紐づけて管理・蓄積しています。

同意取得は、できる限りオプトインの方法で

(3)活用段階での取り組み

 活用段階では、データの安全・安心な分析が課題になります。従来は匿名加工情報を分析する方法が考えられてきました。ですが、情報をある程度抽象化する必要があり活用しにくいという問題がありました。そこで現在は、仮名加工情報がデータ活用の主流になりつつあります。仮名加工情報は、氏名や生年月日などの個人を特定できる情報は削除されているものの、それ以外の情報は、そのまま利用できるため活用しやすい面があります。

 必要に応じて同意の取得方法を検討する必要があります。同意の取り方には大きく「オプトイン」と「オプトアウト」の2つの考え方があります。オプトインは、あらかじめ、はっきりとした同意を得る方法で、同意を得たデータだけが活用できるという考え方です。民間企業が個人データを第三者に提供する場合は原則として「オプトイン」の方法で個人から同意を取得する必要があります。

 一方のオプトアウトは、はっきりした同意は取らず、拒否されれば活用をやめる方法で、拒否されたデータは活用できないという考え方です。オプトアウトの方法を採用するためには、プライバシーポリシーの公表や個人情報保護委員会への事前の届出などが必要です。同意取得が必要な場合は、できる限りオプトインの方法での取得をお薦めします。

 データ活用サイクルを確立し、創薬にも活用できる高いデータ価値を示す事例として、疾患レジストリを紹介しました。しかし、先進的な疾患レジストリの取り組みにも課題があります。

 疾患レジストリは、研究資金で運営されている場合がほとんどです。レジストリを運営する研究者らは、患者や医師の強い思いに応えるため、維持のための資金獲得に多大な努力を払っています。これにより、データ活用サイクルが回っているのです。国からの継続的な補助や、受益者である製薬企業などからの資金面での協力などにより、データ活用サイクルが自然に回る仕組みの実現が望まれます。

 次回は、経済合理性の観点も含め、領域を跨がるデータ活用について解説します。

佐藤 恵一(さとう・けいいち)

日立製作所 公共システム事業部 パブリックセーフティ推進本部 パブリックセーフティ第二部 部長。2000年日立ソフトウェアエンジニアリング株式会社入社。2009年大阪大学大学院工学研究科応用化学専攻博士後期課程修了。同年に秘匿情報管理サービス「匿名バンク」を事業化。産業・金融・公共・ヘルスケア分野に高セキュアなクラウドサービスを展開。2015年日立製作所へ転属、2024年4月1日より現職。現在は「匿名バンク」事業推進を主として、公的機関や民間企業向けのITコンサルティング業務などにも従事。情報処理安全確保支援士。一般社団法人遺伝情報取扱協会理事。博士(工学)。