- Column
- 学校では学べないデジタル時代のデータ分析法
ビッグデータの法則:その2=振り子現象、すべては繰り返す【第21回】
繰り返しはデータ分析で読み解ける
過去の歴史における繰り返しをいくつか紹介したが、これらはデータさえあれば読み解ける。いずれの事象でも、データ分析によって繰り返しパターンを見抜くことが肝要だ。第15回で述べたトポロジカルデータ解析でも、人・モノ・金・ブランドといったデータの点の散らばり方(=分散)や重なり(=集中)を読むことで真実が分る(図6)。
たとえば、多くのヘルスケア関連の分析では、支出した医療費などを可視化し47都道府県で比較している。総額で東京・大阪が多いのは当たり前で、敢えて可視化することもない。一歩進んで1人当たりの金額を出すこともあるが、これも普通の分析だ。
これに対し、一時点ではなく、ある時間を経た後のデータの変化、言い換えるとデータの移動を考えてみるとどうだろうか。その場合は、いち早く変化する、あるいは、最後まで残って変化しないデータが意味を持つ。通常分らないことを分析結果として導きだすことに意味がある。
避難勧告を出すタイミングを考えてみよう。台風・火山爆発など災害に対し早期に避難勧告を出すと、住民の中には、あまりにも早く避難場所に来る人たちと、最後まで自宅に残っている人たちがいる。早く着すぎると避難場所の準備ができておらず入れないし、最後まで自宅に残っている人は手遅れになる可能性が高い。また避難勧告を解除するタイミングも難しい。遅れると住民の不満が増えたりコスト増にもなったりしてしまう。
適切な避難勧告を出す、もしくは解除するタイミングを分析する必要がある。住民行動に関するデータを何回か取れれば、避難・移動・遅れなど繰り返しパターンを把握でき、そのパターンを分析することが災害対策の役に立つ。
筆者は以前、人のミスについて分析したことがある。人はなぜか同じミスを繰り返してしまう。それも局所点が存在し、ミスが集中する時期とミスが少なく分散する時期がある。これも繰り返しパターンを知れば、対策を打ちやすくなる。
最近では、AI(人工知能)を前提に人海戦術でデータを入力する例をよく耳にする。どうしても人手で行わなければならない理由も理解できるが、人手では入力ミスも増える。ただ、データ入力の失敗の仕方にも規則性がある。その法則を見つけ出せればミスを探しやすい。不正も同様だ。人が犯す不正の繰り返しパターンも分析しておけばいい。
繰り返しパターンを見抜くための3つの着眼点
繰り返しパターンを見抜くためにデータを見る際は、次の3点に注目したい。
(1)データの点を膨らませることによる「穴の数」の違い
(2)データどうしの「つながり方」の違い。データのランダム性や、対称性、単純性、規則性などの有無をつかむ
(3)時間による「遷移」での違い
これら穴の数・つながり方・遷移の3点で繰り返しパターンを見抜いていく。たとえば、人口の集中と分散の繰り返しであれば、日本地図に人口の大きさを点としてマッピングすると時代の遷移による違いが明確になってくる。
経験的に言えば、国家予算、自動車部品、商流など、さまざまなデータのそれぞれに独特の繰り返しパターンがある。そのパターンをいち早く掴むことに意味がある。どう分析しても解が見つからない場合は発想を変え、繰り返しパターンを省いた残りに解が眠っていることもある。
以上、振り子現象を見てきた。次回は、『ビッグデータの法則』の3つ目である「数字の魔力」を説明する。筆者が実務でデータ分析する際に、とても重宝している数字を紹介したい。
入江 宏志(いりえ・ひろし)
DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。
ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。