- News
- サービス
AIのためのデータ流通に向けたデータ取引サービス、AIデータ活用コンソーシアムが構築
AI(人工知能)技術の活用において必要な学習用データの流通をうながすための取引サービスをAIデータ活用コンソーシアム(AIDC)が構築し、2021年3月1日からサービスを開始する。契約モデルを実装しでた活用にまつわる種々のリスクを回避できるようにしたという。2021年2月10日に発表した。
AIデータ活用コンソーシアム(AIDC)が構築した「AIDC Data Cloud」は、AI活用に不可欠な学習用データの流通を円滑にするためのクラウド基盤である。データが学習済みモデルなどとして、製品/サービスに組み込まれて流通・利用されるケースが増えていることに対応し、データの提供者および利用者が安心してデータを取引できる流通基盤を提供するのが目的だ(図1)。
AIDC Data Cloudが取引対象にするのは、オリジナルのデータと、学習モデル用にクレンジングあるいはアノテーションしたデータ。データの提供者が望む条件と共にデータを登録し、カタログ化して利用者に提示することで、条件に応じた選択と利用契約の締結が可能になるとしている。
データの取引サービスと契約モデルでは、様々な商流と知的財産保護、および倫理・製造物責任・保証・来歴に考慮した。オープンデータからワンタイムでの利用、レベニューシェアといったデータ取引形態に対応する。
AIDC Data Cloudが想定する利用者は、AI技術を使った製品をエンドユーザーが利用するまでのプロセスに関与するすべての層。具体的には、データ生成者、データアノテーター、AI研究者・AI開発者、コンポーネントメーカー、最終製品メーカー、エンドユーザーなどだ。
従来のデータ活用は、マーケット分析用途など1度の利用で完結する形態が中心だった。しかし、ディープラーニングや機械学習、統計的学習、統計解析などAI技術の活用場面では、データが学習済みモデルなどとして、製品/サービスに組み込まれるケースが増えている。
しかし、データの所有者と、そのデータを使って研究・開発をしたり、製品/サービスを提供したりする利用者は必ずしも同一でない。両者間で円滑なデータの流通体制が望まれていた。
加えて最近は、AIの学習用データとしての流通においても、倫理や知的財産、製造物責任、商流に基づく利益配分など、考慮しなければならない課題が増え複雑になっている。
AIDCは、データ活用には大きく次の3つのリスクがあるとしている。
リスク1 =説明責任とデータ来歴:AIを組み込んだ製品/サービスの製造物責任を果たすためには、AIの学習に使用しているデータの来歴を説明できることが求められている。学習に用いるデータの来歴を適切に把握・管理することが重要になる
リスク2 =知的財産と商流:AIの学習に使用するデータの価値は、AIを組み込んだ製品/サービスがどのように流通し、経済的価値を持つかで大きく異なる。データを提供する際には、AIの学習に用いられることを想定しデータ所有者の権利を考慮した契約モデルの適用が重要になる
リスク3 =データ品質と偏り(バイアス):データの偏り(バイアス)はAI品質の偏りにつながる。公平・均質な品質が求められるソリューションにAIを用いる場合は、その学習データの品質(データの偏りの程度等)を把握することが重要になる
AIDCは、AI活用におけるデータ活用を促すために、知財の取り扱いポリシーや契約ガイドライン、およびデータ流通のためのサービス基盤の実現に取り組むコンソーシアムで、2019年4月に活動を開始した。
発起人には、京都大学、ギリア、国語研究所、日本電子出版協会、東京大学、東洋大学、豊橋技術科学大学、日本財団、日本支援技術協会、日本マイクロソフト、ブリックス、ブロードバンドタワー、理化学研究所、Ridge-iが名を連ねている。