• News
  • 共通

データ分析に必要なデータの前処理サービス、ナウキャストが開始

DIGITAL X 編集部
2021年8月23日

データ分析における活用度を高めるのに必要なデータの前処理サービスを、ビッグデータ解析を手がけるナウキャストが2021年8月5日に開始した。企業が保有するデータと、社外にあるオルタナティブ(代替的)データを組み合わせたデータ分析などを容易にする。同日に発表した。

 ナウキャストの「DataPrep(データプレップ)」は、企業が保有するデータをデータ分析で利用できるようにするためのデータの前処理を実施するサービス。具体的には、(1)ID統合、(2)名寄せ、(3)匿名加工化、(4)マスタリング、(5)クレンジングなどだ。

 DataPrepでは、ビジネス上の目的や、そのために必要なデータ分析工程を踏まえたうえで、データの前処理を実施する。加えて、機械学習などによる自動化を適用し、オペレーターによる手作業と組み合わせて、効率と精度の両方を担保するとしている。

 対応可能なデータは、POS(販売時点情報管理)データと、クレジットカード関連データ、および位置情報。これらのデータは、財務情報や経済統計など伝統的なデータに対し、オルタナティブ(Alternative:代替的)データと呼ばれる。社外から調達するケースも多く、名寄せやクレンジングなどの前処理が不可欠だ。

 DataPrepは、KDDIが提供する機関投資家の投資判断材料である「指定区域来訪データ」で利用されているという。バイアス(偏見や差別)の排除や、店舗・ブランド・企業への名寄せ、時系列に沿った銘柄コードへのひも付けなどのデータクレンジングを実施しているという。

 ナウキャストによれば、「データ利用は前処理が8割」と言われるほど、前処理は重要な工程だが、データを保有する企業が自力で行うには負担が大きい。利用価値があるデータを保有していても、前処理ができないために簡単な集計や加工、統計処理に課題を抱える企業も少なくないとみられている。

 ナウキャストに寄せられる顧客の声でも、「個品レベルのデータ(JANコード)は存在するが、商品ブランドにひも付いておらず、マーケティングに活用できない」「保有するデータをオルタナティブデータとして金融機関に提供したいが、データに銘柄コードが付与できていない」「CRM(顧客関係管理)を推進したいが、顧客IDが社内統合できていない」といったものがあるという。

 DataPrepの利用料金は個別見積もりである。