• Column
  • 学校では学べないデジタル時代のデータ分析法

正しい分析に向けデータの特性と関係性のパターンを知る【第8回】

入江 宏志(DACコンサルティング代表)
2018年4月23日

 「相関」は広義に言えば、「集合」「位置」「類似」の3つに分かれる(図5)。

図5:データの関係性パターン「相関」の3パターン

集合:集合関係は、第5回で述べた『分類』の手段であるクラスター分析や因子分析、そして主成分分析で作られる。分類の前提に「MECE(ミーシー):Mutually Exclusive Collectively Exhaustive」という状態が必要になる。MECEは、データを綺麗にするクレンジング段階に目標とする形を示したもので、データに漏れやダブりがないようにしなければならない。MECEはロジカルシンキング(論理的思考)のフレームワークの1つで、論理的に物事を考える場合には必須である。

位置:位置関係は、第6回で述べた『予測』の手段である地理的プロファイリングなどで使われる。ロジカルシンキングでは、SWOT分析、PPM(Product Portfolio Management)がある。

 SWOT分析は、「Strengths(強み)」「Weaknesses(弱み)」「Opportunities(機会)」「Threats(脅威)」の頭文字をつなげたもの。自社の長短、内部・外部要因を4つの事象の位置関係で表す良く知られるフレームワークだ。PPMは、ボストン・コンサルティング・グループが開発したフレームワークである。市場成長率とマーケットシェアの2軸で「Star(花形商品)」「Cash Cow(金のなる木)」「Problem Child(問題児)」「Dog(負け犬)」の4つに分ける。

類似:相関関係を表し、相関分析が用いられる。相関関係を表すデータが散らばったグラフから類似の関係性を探せる。

 「変化」は「展開」「循環」「因果」の3つに分かれる(図6)。

図6:データの関係性パターン「変化」の3パターン

展開:物事を延べ広げることだが、第7回で述べたベイズ推定に代表される『推論』が関連する。分からないことを観測データから推論できる。ロジカルシンキングでは、演繹法や帰納法が論理展開の基本になる。観測データがなければ、頭の中にあるデータで考えるフェルミ推定もこの領域といえる。

循環:物事が繰り返されることである。どのように循環しているかの関係性を明確にできる。ロジカルシンキングではPDCAを用いる。ご存知の通り「計画(Plan)」「実行(Do)」「評価(Check)」「改善(Act)」という古くからある考え方だ。ただ最近は、年初に計画したことが数カ月も経たないうちに役立たなくなる。PDCAを素早く回しながら「OODA」という考え方で補強している。

 OODAは、「監視(Observe)」「情勢判断(Orient)」「意思決定(Decide)」「行動(Act)」から構成され、環境変化に応じる考え方である。筆者は、OODAの流れである「OODAループ」をデータ分析の方法論として使っている。この詳細は次回以降に述べたい。

因果:要因と結果から因果関係が成り立つこの関係は、函数y = f(x)で表せる。第6回で述べた『予測』の手段で影響度を測るロジスティック回帰分析や先読みする判別分析と関係が深い。

 次回は、データの関係性パターンの続きとして「構造」と「空間」について説明する。

入江 宏志(いりえ・ひろし)

DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。

ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。