• Column
  • 不完全・少量の“レガシーデータ”をAIで活用する

AIシステムに組み込むドメイン知識の実際【第3回】

松崎 潤(日本TCS IoT戦略本部 シニアデータサイエンティスト)
2021年5月6日

第2回では、少量で不完全な“レガシーデータ”の活用例として、交換部品の需要を予測するために、AI(人工知能)システムに数理モデルの形でドメイン知識を組み込んだケースを紹介した。今回は数理モデルの形で組み込めるドメイン知識の具体例や、ドメイン知識をAIシステムに組み込む方法について紹介する。

 これまで、少量・不完全な“レガシーデータ”を分析や予測、意思決定に利用するための方法として、業務やその対象などに関するドメイン知識をAI(人工知能)システムに組み込むことを紹介してきた。

現場の定性的な知識もAIシステムには有効

 ここでいう「AIシステムに組み込めるドメイン知識」とは、業務の過程や対象を要素に分解し、要素とデータの関係や、要素と要素の関係を表したものである。第2回で紹介した交換部品の需要予測の例でいえば、要素とは稼働中の製品数、故障数、修理数、廃棄数である。データは製品や交換部品の出荷数、故障率に影響する要因である。

 要素とデータ、要素と要素の関係とは相関関係のことだ。相関関係とは、ある物事が起こった後に別の物事がよく一緒に起こるとか、ある要素がある値を取った時に別の要素が特定の値を取るといった関係を示すものである。相関関係の中には、より強い関係を示す因果関係がある。因果関係とは、ある物事を原因として別の物事が起こるという原因と結果の関係を示す。

 相関関係は、定性的なものでも定量的なものでも良い。人間の行動や物理法則などについては定量的なモデルが既に存在する場合があるが、現場で蓄積されている知見としては、ある物事が起こると別の物事が起こりやすくなるのか、起こりにくくなるのかといった定性的なものが多いだろう。そうした定性的な知見だけでもAIシステムには貴重な情報になる。

 ある要素の値と別の要素の間に右肩上がりの関係があるのか、右肩下がりの関係があるのかが分かるだけでも良い。定量的な相関関係は、データからAIシステムに推定させることができる(図1)。

図1 ドメイン知識のAIシステムへの組み込み

 さらに言えば、この相関関係は、決定論的なものでも、確率的なものでも良い。決定論的な相関関係とは、ある物事が起こったら“必ず”別のことが起こるとか、ある要素がある値を取ったら別の要素が“特定の”値を取る関係だ。

 確率的な相関関係とは、例えば、ある物事が起こった時に別の物事が、ある確率で起こるが、起こらない場合もあるといった関係である。ある要素が、ある値を取った時に別の要素が“最も取りやすい”値があるものの、その“周りの”値を取る可能性もある関係だ。

 これら確率的な相関関係についても、モデルにより定性的に与えれば、定量的な関係は、データを与えることでAIシステムによって推定できる。