• Column
  • 不完全・少量の“レガシーデータ”をAIで活用する

レガシーデータによる交換部品の需要予測は可能か【第2回】

松崎 潤(日本TCS IoT戦略本部 シニアデータサイエンティスト)
2021年4月7日

第1回では、データ活用における課題である、少量で不完全な“レガシーデータ”を定義し、一例として、新型コロナウィルス対策におけるデータ活用の実情を挙げた。そしてレガシーデータの活用には、業務の過程や対象に関する知識や経験則、学術的知見を含めた「ドメイン知識」が有効であると説明した。今回は、ビジネス分野におけるレガシーデータの活用例として、A社における交換部品の需要予測に対し筆者が提案・開発したモデルを紹介する。

 A社は業務用機械を製造するメーカーである。同社製品は、故障が発生すれば速やかに修理する必要がある場面で利用されている。そのため同社は、交換部品の在庫を確保し、故障発生時には在庫している部品を用いて交換作業を実施している。

交換部品の需要を予測し生産・在庫数を最適にしたい

 A社が求めていたのは、交換部品の需要予測である。同社製品は出荷開始から生産終了までの期間が長期に渡り、実稼働時の故障率を正確に把握するのが難しい。そうした状況下であっても、交換部品の需要を正確に予測し生産計画に反映できれば、速やかに修理できるだけの在庫を確保できる一方、部品を作りすぎて不良在庫になることを防げる。

 交換部品の需要には、製品の出荷数の推移に加え、故障が発生するまでの期間の分布が絡み合う。そのため長期的なトレンドは、製品の出荷開始後、どこかの時点で増大から減少に転じる。しかし、いつ減少に転じるかは、交換部品の出荷数の推移だけを見ても分からない。交換部品の出荷数を単純に可視化するだけでは、人間が判断を下すことは困難である。

 交換部品の出荷数に、既存のAI(人工知能)技術による時系列予測モデルを適用した場合、季節や曜日などの周期性のほかに、一貫した増大や減少などの長期的トレンドがあれば、それを考慮した予測が可能になる。だが、増大から減少への転換を予測できるわけではないため、長期的な予測は不可能だ。

 月当たりの交換部品の出荷数が、「0個から、多くても100個」という少数であることと、データの発生期間が最大10年程度であることが、第1回で定義したレガシーデータの要件の1つにあてはまることも課題である。出荷数が多いことを前提にする既存の時系列予測モデルでは、考慮するデータが少数では的確な予測は難しい。実際、筆者がプロジェクトに参画する前は、既存の時系列予測モデルが適用されており、うまく予測できていなかった。

 そのためA社は、「交換部品の出荷実績」だけでなく「対象の交換部品を用いる製品の出荷実績」も用いて、交換部品の出荷数を予測するモデルの開発を筆者に求めたのである。

 だが、「製品の出荷実績」データを利用しても課題は残る。製品や交換部品の出荷実績の期間が、部品の寿命に対して短かったのだ。さらに、製品出荷直後の古い期間については、製品の出荷実績データは存在するものの、交換部品の出荷実績データが存在しなかった。一部期間のデータが欠損していることもレガシーデータの要件の1つである。

 既存の汎用的な機械学習モデルや統計モデルに基づくAIシステムはデータのみに基づいて学習する。このため、少量で不完全なデータであっても過剰に真に受けて学習してしまう。そのため、A社の課題を克服することは困難だった。