• Column
  • DXの核をなすデータの価値を最大限に引き出す

データ活用サイクル・ステップ2:蓄積段階の取り組みと留意点【第4回】

佐藤 恵一(日立製作所 公共システム事業部 パブリックセーフティ推進本部)
2024年5月16日

前回は、第1回で説明したデータ活用サイクルのステップ1である収集段階の取り組みにおいて、特にパーソナルデータの扱いについて説明しました。今回は、第2ステップである蓄積段階の取り組みについて、セキュリティ対策を中心に説明します。

 情報漏えいにまつわる報道が後を絶ちません。情報漏えいが発生すると、組織のレピュテーション(評判)が低下するだけでなく、膨大な対応工数や費用などの経済的損失が発生します。さらには情報活用の取り組みを継続することにも大きな影響を及ぼします。漏えいの対象が個人情報ともなれば、その影響は拡大します。データの蓄積段階で情報漏えいを防ぐには、情報セキュリティが非常に重要になります。

 情報セキュリティには、(1)機密性、(2)完全性、(3)可用性の3つの要素があります。機密性は不正アクセスや情報漏えいを防ぐこと、完全性はデータの改ざんや破損を防ぐことです。そして可用性は適切なタイミングでアクセスできるようにすることです。これらのバランスをとりながら管理することが重要で、その手段の1つが暗号化です。

暗号化ではデータと鍵の管理が重要に

 暗号化において重要なポイントは大きく次の4つです。

(1)暗号化するたびに暗号文が変わること
(2)暗復号鍵とデータを分離すること
(3)ユーザーごとに異なる暗復号鍵を用いて管理できること
(4)適切な評価機関等により安全性が確認されている暗号技術を用いること

 ポイントのそれぞれについて見ていきましょう。

ポイント1:暗号化するたびに暗号文が変わること

 暗号化方式は大きく、(1)決定性暗号と(2)確率暗号に分けられます。

決定性暗号 :1つの平文を暗号化すると1つの暗号文が生成される方式です。平文の出現頻度と暗号文の出現頻度が同一になります。そのため名字や男女比、年齢構成など統計情報で公になっている個人情報の場合、統計上の出現頻度と暗号文の出現頻度を比較する頻度分析により暗号文を解読されてしまうリスクがあります。

確率暗号 :1つの平文を暗号化するたびに暗号文が変わる方式です。ランダムな数列である乱数と等価な暗号文にすることで頻度分析を困難にし安全性を高めています。個人情報保護委員会が定める「個人情報の保護に関する法律についてのガイドライン(仮名加工情報・匿名加工情報編)」では、他の記述に置き換えた「仮ID」などを付与する際は、元の記述に復元できる規則性を有しない方法として、乱数に言及しています。

ポイント2:暗復号鍵とデータを分離すること

 暗号化・復号に用いる鍵の保管場所とデータの保管場所が分離していることも重要です。同じ場所にあると、データセンターの管理者などは鍵とデータの両方にアクセスできてしまうため、漏えいにつながる内部犯行リスクが高まります。情報処理をメモリー上で実行し、そこで鍵を用いて復号している場合は、外部から攻撃された際に平文で情報が漏えいするリスクがあります。

ポイント3:ユーザーごとに異なる暗復号鍵を用いて管理できること

 安全性と運用面の観点から、暗復号鍵はユーザーごとに異なることが望ましいといえます。すべてのユーザーが共通の鍵を使用している場合、例えば、あるユーザーのアカウントを削除する際に、共通の鍵をそのまま使い続けると、アカウントを削除したユーザーの手元にも有効な鍵が残るため、安全性に問題が生じます。

 一方、新たな鍵を発行しようとすると、すべてのユーザーが鍵を更新しなければならず、ユーザーに変更があれば都度、鍵を更新することになり、運用が非常に煩雑になります。

ポイント4:適切な評価機関等により安全性が確認されている暗号技術を用いること

 デジタル庁・総務省・経済産業省は、暗号技術検討会および関連委員会である「CRYPTREC(クリプトレック)」を開催し、推奨する暗号リストとして「CRYPTREC暗号リスト(電子政府推奨暗号リスト)https://www.cryptrec.go.jp/list.html」を公開しています。同リストに掲載されている暗号技術は安全性が確認されているといえるでしょう。