• Column
  • 学校では学べないデジタル時代のデータ分析法

お金の分析:解説編=ライフイベントの辞書から年代別モデルを作る【第29回】

入江 宏志(DACコンサルティング代表)
2019年12月23日

最適解にたどりつくには順を追った分析が必要

 ライフイベントの辞書を構築できれば分析が始められる。分析手順は、フェーズD、フェーズE、フェーズFの3段階を踏む(図2)。

図2:ライフイベントの辞書をもとにした分析手順

 20代から60代までを分類するため、クラスター分析を実施しながら、ライフイベントを中心に、お金について考慮すべき議題について解析する。条件によって正解は変わる。最適な解にたどりつくように順を追って分析していかねばならない。

フェーズD:ライフイベントから重要な検討課題(Issue)を抽出する

  分析者のノウハウ :紐付ける力
  分析手法の例 :テキストマイニングなど

 フェーズDで重要な検討課題を手っ取り早く抽出するには、関連する膨大なデータをテキストマイニングする(第14回参照)。そこから、ライフイベントのキーワード(たとえば第27回では『早期退職』)に紐付けられた項目を取り上げれば良い。ネット上で簡単にテキストマイニングできるサービスもある。テキストマイニング後は分析者が「紐付ける力」で補正する(第18回参照)。

フェーズE:各検討課題について分析し深い考察(Deep Thinking)と結論を導き出す

  分析者のノウハウ :ロジカルシンキング
  分析手法の例 :トポロジカルデータ解析、回帰分析、クロス集計など

 検討課題について分析するために、わざわざITツールを使う必要はない。ロジカルシンキング(論理的思考、第8回第9回の図参照)の各種フレームワークで深堀りすれば良い。ロジックツリーやピラミッド構造でも良いだろう。

 筆者は、分析手法として専門的にはトポロジカルデータ解析を駆使している(第9回参照)。データ群を空間とみなし、その形に注目することでデータ群に埋もれた価値を探す手法である。空間の考えでデータを本質的に抽出できる。

 お金に関するデータを空間とみなすと、x軸、y軸、z軸の属性は、年代、各ライフイベント、考慮すべき議題、必要な金額、テキストマイニングであぶりだされたキーワードといった数値データや非数値データから得られる。極端に言えば、表1もx軸を各ライフイベント、y軸を考慮すべき議題、z軸を年代とすれば、3次元として見ることもできる。

 他にも回帰分析(第6回参照)、クロス集計(第5回参照)など様々な分析手法を使って深堀りしていく。この過程を筆者は「Deep Thinking」と呼んでいる。これにより各年代別の結論を得られる。

フェーズF:生き残る方策(Core Point)をまとめる

   分析者のノウハウ :クリエイティブシンキング
   分析手法の例 :ベイズ推定、決定木分析、ランダムフォレストなど

 フェーズFで生き残る方策を得る段階でも、ITツールを使わなくても条件ごとに、どのように結果が変わっていくか自由闊達に創造できる力、つまり創造力があれば良い。これをロジカルシンキングに対して「創造的思考(クリエイティブシンキング)」と言う。

 古くはブレインストーミング、マインドマップ、最近ではサービスデザイン思考などがある。論理的な矛盾があっても受け入れる柔軟さ、これまでの枠にとらわれない独自な考えが必要になり、AI(人工知能)が苦手とする領域である。頭の中だけならば「想像力」だが、それが他の人にも見える形(ビジネスモデル、ハードウェア、ソフトウェアなど)にするのが「創造力」である。この力がフェーズFでは求められる。

 専門的に分析する場合、ベイズ推定(第7回参照)で分析者が主観的な推論を加え、さらに決定木分析(第5回参照)で絞り込みながら、生き残る方策に仕上げていく。その際、収入・金融資産・不動産などの条件別に予測する段階で、決定木モデルを使う。決定木モデルを使うことで、場合分けが容易になる。

 ただし、この決定木モデルの問題点として「過学習(第14回参照)」が挙げられる。1つのことにこだわり過ぎて本質を見失ってしまう現象だ。過学習への対処には「ランダムフォレスト」が用いられる。決定木を複数作り、それらの結果を総合的に判断するもので、多数決や平均などを取る方法だ。

 これら手法を使いこなすことで、さまざまなタイプの人について、お金で最適な解にたどり着ける。