• News
  • 共通

個人情報の分析精度を高めるための架空データを生成するソフトウェア、NTTテクノクロスが発売

DIGITAL X 編集部
2021年11月5日

個人情報を扱うAI(人工知能)システムの精度向上に必要な学習データとして、架空の個人データを生成できるソフトウェアをNTTテクノクロスが2021年11月17日に発売する。匿名加工情報作成ソフトウェアの最新バージョンに、新機能として追加する。2021年10月26日に発表した。

 NTTテクノクロスの「tasokarena」は、匿名加工情報作成ソフトウェア。2021年11月17日に発売する最新の「V4」では、個人情報を対象にした分析システムの精度向上や範囲拡大に必要な、少ない匿名データから架空の個人情報データを大量に合成する機能を追加した(図1)。AI(人工知能)の学習や訓練などに活用できるとする。

図1:「tasokarena V4」では、少ない匿名データから架空の個人情報を合成する

 新機能では匿名データから、特徴量や統計量・分布などが類似するデータを合成することで「実在しないが具体的な個人情報」を作り上げる。匿名性やプライバシーを守りながら、元のデータの性質や有用性を保持できるとする。例えば、数値属性を維持したまま複数の属性の相関関係に関する統計分析などに利用できる。

 NTTテクノクロスによれば、元の匿名データの数が少ない場合にはデータの匿名性か有用性のどちらかが低下する。緻密な分析に向けては、データの有用性の観点から、匿名加工情報ではなく、実際の個人情報が活用されていたりするのが現状だ。

 新機能は、NTT社会情報研究所の合成データ生成技術を使って実現した。属性の平均など統計値が元データとほぼ等しい合成データを生成する技術などにより、分析に必要な複数の統計値を保持する多属性の合成データを生成する。従来の匿名加工における情報の一般化や削除、ランダム化で生成したデータに比べ、より緻密な分析が可能になるという。

 tasokarenaの利用料金は、スタンダード版(GUI版)が年間60万円(税別、以下同)から。自動実行/データ連携機能を持つエンタープライズ版が180万円から。