• Column
  • 学校では学べないデジタル時代のデータ分析法

データの関係性パターンとしての「構造」と「空間」【第9回】

入江 宏志(DACコンサルティング代表)
2018年5月28日

 図2および図3では、一時点で可視化しモデリングがしやすいようにB2B2B構造を3層にしている。なお、モデリングとはデータを情報にするプロセスを指す。当然、層が3つ以上の場合も対応でき、部品やメーカーを切り替えれば全体が網羅できる。最初はデータ構造を5層も6層も表そうと試みたが限界があった。そのため、人間が可視化でき、快適な構造となる3層にした。

 このフレームワークの中では、ロジカルシンキングでいう「3C:顧客(Customer)、競合(Competitor)、自社(Company)」と「4P:製品(Product)、価格(Price)、流通(Place)、販促(Promotion)」「5F:(1)新規参入業者の脅威、(2)買い手の交渉力、(3)売り手の交渉力、(4)業界内の競争、(5)代替品の脅威の5つの力」を表している。

 これは、偏った1つのデータソースではなく、あらゆるデータ、言い換えれば、Any Data、Trusted Data、Open Data、Alternative Dataなどが分析対象である。企業の先の先、部品の先の先までたどれる。“先の先”を分析できるので「B2B2B分析」と名付けた。

 このフレームワークは、もともと自動車部品で考えたデータを整理するために考案した。そのデモを見た他業界の方々からの依頼で、国家予算やヘルスケアなどの業界における関係性の可視化にも適用した。国家予算については、「部品」を「予算」に、「メーカー」を「法人」に応用することで関係性が可視化でき、予算の源流がたどれる。ヘルスケアも同様で、病気や症状などとの関係性を可視化できる。

空間の把握で活躍するトポロジカルデータ解析

 関係性のもう1つのパターンが「空間」である。空間は、数学では幾何の領域になる。筆者は数学科の出身で、専門は幾何の中でトポロジーであった。幾何の世界では“美しい形”が大切だ。対称性が高く、歪みがない。

 ところがトポロジーでは“美しい”という制限はない。柔らかい考え方を取るので“柔らかい幾何”ともいわれる。たとえば、アルファベットの「Y」と「T」はトポロジーの世界では同じとみる。Yの左右を引っ張ればTになるという大胆な考えだ。同様に、「ドーナツ」と「コーヒーカップ」も同じになる。どちらも穴の数が1つという点で同じだからである。

 この考えに基づいたのが「トポロジー分析」であり「トポロジカルデータ解析(Topological Data Analysis)」ともいう。データ群を空間とみなし、その形に注目することでデータ群に埋もれた価値を探す手法である。空間の考えでデータを本質的に抽出できる。

 トポロジーでは、前述したようにデータ群の穴の数が重要である。そこに本質が眠っている。2つの似たようなデータ群を空間で把握し、特異点を見出だす(図4)。

図4:関係性パターン「空間」に基づくトポロジカルデータ解析

 たとえば、国家予算の流れを可視化する際であれば、年度別のデータを空間とみなす。x軸、y軸、z軸の属性は、予算額・決算額・前年度比・予実対比などの数値データのほか、上位予算・主管部門・予算への添付資料の有無・移管先などの非数値データを自由に割り当てられる。予算は毎年、概ね同じような流れや形を採るが、近い将来の日本市場に影響を与える予算項目などは“異常値”として埋もれている。

 経験的に言うと「特異点は、なかなか見つからないが、存在すると局所的に固まっていることが少なくない」。なお、ディープラーニング(深層学習)における画像認識でも、分析対象の特徴量(形、色、並び方など)を表現する場合、属性としてx軸・y軸・z軸の座標軸が使える。

 空間全体をどう把握するかという課題があるとき、全体を分析しようとするとお金も時間もかかる。そこで疎(まば)らにデータを取る手法が注目されている。これを「スパースモデリング(Sparse Modeling)」という。フラクタルのような状況からデータを抜き出すT字/逆T字フレームワークは、スパースモデリングとも言えるだろう。

 データ関係性のパターンとして「相関」「変化」「構造」「空間」を述べてきた。次回は人間の行動や感情にかかるデータを見てみよう。

入江 宏志(いりえ・ひろし)

DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。

ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。