• Column
  • 不完全・少量の“レガシーデータ”をAIで活用する

ドメイン知識をAIシステムに組み込む過程で組織も改善できる【第4回】

松崎 潤(日本TCS IoT戦略本部 シニアデータサイエンティスト)
2021年6月3日

権威主義的な意思決定の過程を改良し組織のパフォーマンスを改善する

 組織における意思決定では、根拠がなくても、単に職位が上の者、経験が長い者、年長の者の意見が優先されることも多い。これらの特徴を持つ者の判断と、価値を最大化するアクションが相関することが多いとみなされてきたためだと考えられる。

 不確実な予測しかできない状況では特に、多くの状態やアクションと評価を見聞した、経験が長い者や年長の者の判断が、価値を最大化するアクションである可能性が高いとみなされがちだろう。職位が上の者、経験が長い者や年長の者の判断が優先される組織や社会において、情報が隠されたり改ざんされたりしがちなのは、1つには予測を不確実にすることで、結果的に彼らが意思決定を下すことを正当化する状況を作り出す効果があるためだ。

 一方で、正確な予測のための環境は日々向上している。例え不完全で少量、誤りを含み一貫性がないレガシーデータであっても、日々の業務のなかで蓄積されている。レガシーデータを利用するための技術改良が続けられており、計算資源も増大し続けている。

 担当者も、データを見ながら判断を下し、業務やその対象に関する知見を蓄積している。より一般的に通用する学術的な知見も、世界中で蓄積されている。

 従って現在は、ドメイン知識を組み込んだAIシステムを開発し、運用する環境が整っている。開発や運用の中で意思決定の過程を分解・明示して検証の対象にし、これを継続的に改良することで組織のパフォーマンスを改善できる可能性は高い。

 科学研究と同様に、数理モデルの形で定式化されたドメイン知識や評価基準、データといった実体に基づいて意思決定を下すことは、関わる者すべてが意思決定と、その改良による組織のパフォーマンス改善に貢献する可能性を開く。

デジタルツインはドメイン知識をAIシステムに組み込んだ例

 最近、「デジタルツイン」というキーワードを見聞きする機会が増えている。デジタルツインは、意思決定の参考としてリアルタイムにデータを収集し可視化するシステムから、データに基づく予測と意思決定や制御のためのAIシステムまでを含む広い概念だ。AIシステムを指す場合は、一部に物理モデルが導入されることがある。

 デジタルツインにおける物理モデルは、ドメイン知識を数理モデルとして機械学習モデルに組み込んでいる例である。ドメイン知識を確率的なモデルとして導入できれば、稀な状況に対しても頑健な予測と意思決定が可能になる。しかし、大量のセンサーデータを処理する必要があるため、確率的なモデルはあまり一般的ではないと思われる。

 現在、AIシステムを開発する場合、ドメイン知識を組み込まない、汎用の構造を持つ機械学習モデルをビッグデータと組み合わせて用いる場合が一般的だ。汎用の構造を持つ機械学習モデルは、大量のデータでも高速に学習できるように、その構造に合わせた学習アルゴリズムが確立されていることが大きな要因である。ドメイン知識を数理モデル化する手間をかける必要がなく、そのためのスキルも求められない。

 これに対し、機械学習モデルにドメイン知識を組み込むと、専用の構造や複雑な制約を含むことになるために、高速に学習できるアルゴリズムが存在せず、現状ではセンサーデータなどのビッグデータへの適用は難しい。さらに、ドメイン知識を深く理解した上で、これを確率的、または決定論的な数理モデルに変換するスキルも必要になる。

 しかし、AIシステムに必要な全ての情報をデータとして与えられる状況は多くはない。デジタルツインの概念やその活用が広がるに伴い、ドメイン知識を組み込んだ機械学習モデルへの需要は高まっていくはずだ。

 計算資源の増大や、学習アルゴリズムの改良、量子コンピューターの導入などにより、ビッグデータに関しても、実用的な時間での学習が可能になっていくだろう。ドメイン知識の数理モデルへの変換に関しても、それぞれの領域に特化したツールの開発などにより、効率が高まっていくと見込まれる。

 これらの取り組みを背景に、AIシステムに直接ドメイン知識を組み込む方法は、レガシーデータを利用する場合にとどまらず、より一般的な手法として利用されていくだろう。

松崎 潤(まつざき・じゅん)

日本タタ・コンサルタンシー・サービシズ(日本TCS)IoT戦略本部 シニアデータサイエンティスト。東京大学にて博士(農学)を取得後、北海道大学、農業生物資源研究所(現農業・食品産業技術総合研究機構)、理化学研究所にて研究員を務め、ドメイン知識のモデル化に基づくデータ分析を植物科学に導入した。その後、データ分析企業に転じて様々な業種のプロジェクトに従事。現職では製造業をはじめとする顧客向けに、データとモデルを用いた分析、予測および意思決定に関する技術の提案と開発に携わっている。