• Column
  • 学校では学べないデジタル時代のデータ分析法

データ分析で失敗しないための5つのポイント【第12回】

入江 宏志(DACコンサルティング代表)
2018年8月27日

経験に裏付けされた失敗しない5つの分析ポイント

 AUOODAは、データ分析に役立つフレームワークではあるが、それだけで成功するわけではない。実際の分析に携わってきた筆者の経験から、失敗しないための重要なポイントとして5つを挙げたい。

ポイント1:騙されない

 失敗のパターンがある。「○○〇というツールを使ったがうまくいかなかった。しかも高額の費用がかかった。△△△というツールの売り込みがあったので話を聞くと良さそうで、しかも安い。だから使ってみようか・・・」である。いくらツールを変更してもうまくいかない。

 心理的に人は、自分が信じたい話を信じたがる。○○〇というツールを嫌いになっている自分に同調してくれる△△△の営業話につい乗ってしまう。これをミラーリングの効果と言い、なぜか騙されてしまう。

 たとえば「この神社は宝くじに当たった人が多い」と聞きお参りに行く。本当かもしれないが何の根拠もない。「東大合格者名□□□人」といった宣伝文句が踊るが、予備校Aと予備校B、予備校Cと東大の合格者数を足すと、実際の入学者数よりはるかに多い。いずれも個人情報保護法を盾に「当たった人」「合格した人」は開示されない。

 そこで役立つのが推論だ。推論した上で、信じるかどうか決めたほうがいい。ツールもそうだ。紙芝居でデモを見せられても何の説得力もない。デモ用のデータではなく、自らのデータで試そう。

ポイント2:順序を間違わない

 失敗のほとんどが、分析の順番を間違えていることが原因である。すでに経験値で分かっていることを可視化するならば逆問題でツールを使えば問題はない。しかし、試行錯誤を伴う場合、すぐにツールの効果は出ない。単なる統計ツールならば順問題があうはずもない。

 AI(人工知能)も教師データ付きならば、その教師データを人が入力しなければならない。それを機械化しない限りは人海戦術になるのは仕方がない。自ら分析したいことが順問題なのか逆問題なのかを自問してからスタートしよう。順問題であるのに逆問題用のツールをいくら用意してもうまくいかないし、それを別の逆問題用ツールに取り換えてもうまくいくはずはない。

ポイント3:紐付けで可能性を広げ、創造・想像のきっかけを得る

 複数のデータ群を衝突させながら共通点を見つける。Trusted Data(信頼できるデータ)や、Any Data(さまざまなデータ)、Open Data(自由に利用できるデータ)、Alternative Data(公開情報ではない非伝統的なデータ)などである。

 筆者の造語であるが「ビッグデータのベン図」も分析フレームワークとして使っている(図3)。1つのデータ群を従来同様に分析しても気付きは少ない、あるいは、少なく見える。ベン図の交わりの部分にヒントがあり、2つ、3つのグループの積集合に気付きが含まれている。

図3:データを紐付けする分析フレームワークとなる「ビッグデータのベン図」

 ビッグデータのベン図の考え方は、データサイエンティスト以外も身に付けるべきだろう。企業が持つデータは、人事情報は人事部、営業情報は営業部など、所属部署から“門外不出”になっているものが大多数だ。外部持ち出し禁止のデータを、いくら守秘義務契約を結んだコンサルタントであっても、外に出すのは垣根が高い。データに一番近い者が分析するのが一番である。

 その意味で、すべてのビジネスパーソンにできるデータ分析法が考慮されるべきで、そのための人材育成が欠かせない。データ分析はデータサイエンティストにのみ必要なスキルではなく、すべてのビジネスパーソンに必須な武器になってきている。

ポイント4:先の先を見て違和感・特異点・変曲点を知る

 企業の取引先であるバイヤーやサプライヤーとの関係は「B2B2B(企業対企業対企業)」の構造になる。製造しているモノと、その上位部品/下位部品との関係もB2B2B構造だ。この関係性を分析することを筆者は「B2B2B分析」と呼んでいることは第9回に述べたとおりである。

 企業に限らず、先の先を見ることにより、いつもと違うことが分かる、分析者にとってまず必要なものは“違和感”だ。データの中で何かが違うという感覚である。その違和感から特異点や変曲点があぶり出される。特異点は似通った群の中からの違いであり、変曲点は普通の流れの潮目が変わるターニングポイントである。

 B2B2Bを応用すれば「B2B2C(企業対企業対個人)」となるので、「B2B2C分析」としても使える。実際、医療機器の分野は参入者が多くビジネスモデルはB2B2Cになっており、分析の重要な領域である。

ポイント5:データ分析で得た結論を評価する

 分析した結果に自己満足することなく、冷静に次の3つの質問を自問自答しなければならない。(1)学習・推論で得た結論を 正確性(=精度)と完全性(=網羅性)を考慮してどう評価するか?、(2)その結論を安心して使えるか?、(3)発想力によって応用できるか?である。

 確かに自分が出した結果を自らが評価することは難しい。そのためには複数人のグループで分析することをお勧めする。

自動運転、AI、ロボットの動きもAUOODAで説明可

 いかがだっただろうか。分析フレームワークとして、OODAループをロジカルシンキングに基づいて改良したAUOODAとビッグデータのベン図について、それぞれの概要を紹介した。AUOODAを用いれば、データ分析だけでなく、自動運転やAI、ロボットなど「知覚」「認知」「判断」「操作」といった動きも対象も説明できる。知覚=Arrange、認知=Understand & Observe、判断=Orient & Decide、操作=Actと考えれば良い。

 次回はデータ分析における心理的な影響を述べたい。

入江 宏志(いりえ・ひろし)

DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。

ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。