- UseCase
- 交通
米アメリカン航空、運行遅延の削減に向け予測型データ分析を推進
記述モデルより複雑な予測モデルの構築に苦心
近い将来の運行遅延を予測しようとするとして、どの程度まで先を見通せるものなのか。アメリカン航空は近い将来を「1〜3日先」(Babcock氏)と定めた。期間を長くすればするほど、予測は、より難しくなるからだ。
アメリカン航空が予測的アナリティクスで使用しているデータの多くは、航空機や運行に関するデータである。Babcock氏によれば、「例えば、遅延増加に影響を及ぼす要素には、ハブ空港から出発する便数、全機を対象とする予測遅延数、特定の機体、前回の機体チェックからの経過時間など」がある。
一方、逆の働きをする要素には、「特定の空港からの便数、過去7日間〜3カ月の航空機遅延の比率、現地時刻の早朝にハブ空港を出発する機体、現地時刻の正午に出発する機体などがある」(Babcock氏)。これらの要素を予測モデルの構築では「多角的に分析しなければならなかった」(同)という。
予測的アナリティクスに取り組む前から、同社は遅れる確率の高いフライトがあることは薄々わかっていたという。取り組みを通じて改めて明確になったのが、「運行遅延では、機体の種類、整備の状況、季節性、駐機場の状態など、様々な要素の影響を受けることだ」とBabcock氏は明かす。
また、「シカゴで遅延が発生した際に、ロサンゼルスでも同様に遅れる場合もあれば遅れない場合もあり得る」(Babcock氏)。そうしたことから、予測モデルの構築では「記述モデル同士の相関を考慮したり、他の非効率な要素をモデルに組み込んだりする必要があることに気が付いた」(同)としている。
新しく予測モデルを構築する上で取り組んだのが、モデリングのための仮説の立案と検証、分析に必要なデータやリソース、および懸案事項の整理だった。ツールに関しては、従来のアナリティクスで使ってきた分析ツール「Teradata Aster Analytics」に加え、予測モデルの構築と検証に「SAS」を導入した。
取り組みの中で時間がかかったのは、予測モデルの構築に使うデータセットの準備であった。今までとはモデリングのやり方が異なるため、「データウェアハウスの中を調べ、テスト環境でデータ統合や新しいテーブルの追加を必要とした」(Babcock氏)。そのうえで、完成した予測モデルが正確かどうかを検証した。
今後も予測モデルの改善を継続する
アメリカン航空の予測的アナリティクスへのシフトは現在も進行中である。現状の予測モデルをより良いものに改善するため、新しいデータを使うことを視野に入れる。
Babcock氏が直近で注目しているのは、「整備担当者や整備プロセスに関するデータ」である。また、飛行中の機体のデータはスナップショットで取得しているが、「ストリーミングデータを使うようになれば、地上だけではなく、飛行中の機内で対処する可能性も出てくる。そうなると、これまで以上に洗練されたデータ分析のためのインフラを整備する必要もある」(同)とみる。
アメリカン航空は今後も、常に新しいデータを使い、継続的に予測モデルを洗練させながら、そこから得られたインサイトに基づき、主要空港での遅延対応プロセスを改善していく計画である。
企業/組織名 | 米アメリカン航空 |
業種 | 航空サービス |
地域 | 米国、他世界各国 |
課題 | 複雑な飛行ルートでそれぞれの機体を運用しており、状況把握を中心とした従来のアナリティクスでは運行遅延の根本的な解決が難しかった |
解決の仕組み | 運行遅延に影響する要素を洗い出し、新しく予測モデルの構築とモデルの改善を進めている |
推進母体/体制 | 米アメリカン航空 |
活用しているデータ | 航空機のヘルスモニタリングデータ |
採用している製品/サービス/技術 | 「Teradata Aster Analytics」(米Teradata製)、「SAS」(米SAS Institute製) |
稼働時期 | 2015年に着手し、現在も改善しながら推進している |