- Column
- データ活用で失敗しないための3つの条件〔ビジネス部門編〕
データ活用のプロジェクトサイクルを確立する【条件3】
データ活用で失敗しないための3つの条件として、第1回では「データドリブンな文化の醸成」を、第2回では「データのマッピング」を挙げました。最後の条件として、データ活用を一過性のプロジェクトで終わらせないための「プロジェクトサイクル」について説明します。
データ活用の目的を組織内で共有し、必要なデータもそろってくれば、いよいよ分析が始まります。ただ「分析」といっても、さまざまな段階があります。以下では、その段階を追って留意点を説明していきましょう、
可視化だけでも価値を得られる可能性は高い
分析において「可視化」は最も重要なフェーズだといっても過言ではありません。可視化だけでも、データ分析として価値がある可能性は大いにありますし、この後に続く統計分析や機械学習の準備という意味でも重要です。たとえば時系列データであれば、可視化により季節性や経年変化、「スパイク」と呼ばれる異常値などを読み取れます。
図1は、架空のシステムの月次負荷量データをExcelの作図機能でプロットしたものです。図1だけでも「毎年3月にスパイクがある」「四半期ごとに負荷が上がる」「経年で負荷が増加している」といったことが分かります。可視化から大きな利益を得られることは少なくありません。可視化が奏功した例として、バス事業者による利用状況の分析を紹介しましょう。
あるバス事業者は、乗客の利便性を維持しながら収益の向上を図るため、利用状況の変化に合わせて定期的に路線やダイヤ編成を見直しています。この作業は従来、熟練者が膨大なデータを経験に基づいて処理してきたため実施に多くの時間を要し、改善が求められていました。
データ分析プロジェクトにおいては、このバス事業者の目標の1つを「ダイヤ編成見直しの費用対効果の向上」としました。次に、この目標を分析課題に落とし込みました。
ダイヤ編成を見直すには、利用状況の的確な把握が欠かせません。膨大なデータを分かりやすく見せることで、ダイヤ編成見直しの迅速化が図れると考え、分析課題は「バス利用状況の可視化」としました。
課題をより具体化してからデータの検討に当たります。検討の結果、停留所ごとの乗降客数、位置情報、乗降客の属性情報を利用することで、ダイヤ再編成に必要なバス利用状況の可視化ができることが分かりました。
そこで、路線を選択すれば、その路線の停留所間の乗客人数を、混雑状況が分かるように色分けして表示するシステムを作成しました(図2)。このシステムによって、バス路線の増便・減便などを運行計画へ迅速に反映できるようになりました。
この例では、定期券情報から乗降客の属性を抽出することで、減便する際には通学客に影響を与えない範囲で実施するといった対応が可能になりました。このように一度データ活用を始めると「このデータはあそこに使えるかもしれない」など次々に副次的なアイデアが湧いてきて、データ活用の良いサイクルを生み出せます。