- Column
- データ活用力をDataOpsで高める
データ活用成功の鍵は高品質なデータにあり【第2回】
データの収集・活用方法は逆算で考える
次に、具体的なデータの収集方法を考えていこう。
高品質なデータを収集するには、最初にデータを活用して価値を創出するという目的を定める。その上で逆算し、データの要求に落とし込んでいき、該当するデータを収集するというのが基本的な流れになる(図1)。
そのためにはまず、価値を創出するための意思決定のポイントを、データを活用する業務部門が中心になって決める(意思決定の要求)。続いて、データ分析の専門家の支援を受けながら、意思決定を改善するための分析・可視化の精度を想定する(分析・可視化の要求)。
そして、その精度を満たすために必要なデータを蓄積あるいは供給する(蓄積・供給の要求)といった順に整理する。必要なデータがまだ蓄積されていない場合には、その前に取得する必要が生まれる(データの要求)。
このように活用目的である価値の創出に紐付いたデータを逆算式で設計し、それに沿ったデータを能動的に取得し活用していくことが「事業貢献できるデータ活用」への近道になる。
ただし、必要となる要求の内容をあらかじめ完全に整理することは不可能だという点に注意したい。前述した予知保全におけるノイズや、需要予測における販売変動要因といった例のように、分析結果や活用結果がフィードバックされてから新しいデータの要求が生まれるケースがほとんどだ。このため、新たなデータの要求に対して迅速に対応できることも、データ活用には重要である。
一方、データを届ける側の現場からすると、要求が増えると負荷になる。取得データをむやみに増やそうとすると、現場の反発が生じて改善の阻害要因になるケースも多い。
これを避けるには、新規データを届ける側の負荷を可能な限り低減するように工夫する。具体的には、データの蓄積場所や導線、届けるために必要な機能などのアーキテクチャーを整理し、新規開発の要素が少なく、かつ拡張性の高いデータ基盤を整備する。
事業貢献という共通の目的のために協働できる体制や文化を形成したり、データマネジメント業務を担う部隊を設置したりするといった対策を並列に実行することも考えられる。
データ品質の継続的な向上を心がける
将来的にデータ活用の文化が組織内に広がると、1つの業務で発生したデータを、さまざまな目的で活用するようになる可能性がでてくる。すると、目的ごとに価値創出から必要なデータを決めていく方法のままでは無駄が多く、ガバナンスが機能せずに思わぬ事故が発生する危険性がある。
目的ごとに整理したデータの要求に対し、既に要求を満たすデータが蓄積されていれば、データ活用の効率は飛躍的に高まるだろう。さらにデータの所在や意味、データ項目の定義などを共有できれば、データを活用する側が単独で必要なデータを探せるようになる。データマネジメント部隊も活動が容易になる。
共通資産になり得るデータについては、組織全体の事業貢献という視点で共有・再利用性の向上やガバナンスの確保を進めていく必要がある。
データの品質を向上させるためにも、データ基盤やデータ活用・データマネジメントのプロセス、組織間連携のための体制や文化など、さまざまな観点で理想と現状のギャップを洗い出し、常時適切な対策を検討して進めていくのが望ましい。
そのためには、一部の組織だけでデータやデータ基盤を整備するのではなく、データ活用に関係する組織、そして担当者全員の協働が必要だ。関係する全員が高品質なデータを志向し「データを活用して業務を改善する」「業務へのデータ活用で得られた価値や知見をフィードバックしてデータを改善する」というサイクルを高速かつ高品質に回すことのできる状態。これこそがDataOpsが示す理想像である。
データの品質向上と業務活用の間にはギャップがある。そのため、品質向上の活動単体ではコストと捉えられがちだ。DataOpsのコンセプトに基づいてDataとOpsをつなぐサイクルを持続的に回すことで、データの品質向上が事業貢献に密接に関わることを可視化しつつ進めることが望ましい。
橋本 秀太郎(はしもと・しゅうたろう)
日鉄ソリューションズ DX推進&ソリューション企画・コンサルティングセンター エキスパート 兼 技術本部 システム研究開発センター インテリジェンス研究部 主務研究員。博士(情報科学)。2014年新日鉄住金ソリューションズ(現日鉄ソリューションズ)入社後、研究開発部門でデータ分析に関する研究開発および案件に従事。2020年より現職。機械学習モデルの開発や運用保守、DataOpsに関する研究開発に取り組みつつ、製造業をはじめとした幅広い業種のデータ分析やデータ基盤構築の実行およびチームリーダーを担当している。