• Column
  • 学校では学べないデジタル時代のデータ分析法

データの関係性パターンとしての「構造」と「空間」【第9回】

入江 宏志(DACコンサルティング代表)
2018年5月28日

前回から、データ分析の対象である「データ」そのものについて考えている。前回は、データの関係性に見られるパターンとして「相関」と「変化」について述べた。今回は「構造」と「空間」を取り上げる。

 データの関係性に見られるパターンの1つが構造である(図1)。

図1:データの関係性パターンの1つである「構造」

 構造を表す手段の代表的なものが「階層」だ。だが階層だけでは、データ分析の実プロジェクトでは物足りない。大きく2つの課題に直面するためである。

課題点1:複雑なデータ構造への対応

 第8回において「Trusted Data」を説明した際に指摘したように、階層化では、分析の過程でデータの対象が逆に大きくなっていく。たとえば、自動車部品というデータについて分析していくと、その上位部品あるいは下位部品へと対象は広がっていく。加えて、部品を製造するメーカー、その部品のバイヤーやサプライヤー、脅威となる競合会社や新規参入メーカー、さらに部品を置き換える代替品などにも対象は広がっていく。

 分析対象である全体の、どの一部を取り出して拡大しても、似たような構造が出てくる。これを幾何学の世界では「自己相似」と呼ぶ。一部が全体と自己相似な構造を持っていて、まるでフラクタルのようである。

課題点2:“未知の未知”への対応

 ビジネスの4大経営資源は「ヒト・モノ・カネ・データ」である。分析対象も同じく、これら4大要素を分析対象にしてきた。しかし、B2B2B(企業対企業対企業)の領域でのデータ分析では、今見えているデータの“先の先”、つまり未だ見えていないデータをつないでいかねばならない。

 リスク管理の分野には「Unknown unknowns(未知の未知)」という言葉がある。何が分からないかが分からないという、一番悪い状況だ。せめて何が分らないかを理解する「Known unknowns(既知の未知)」にはしたい。

 そのためには、「Any Data」「Trusted Data」「Open Data」「Alternative Data」など、一見関係がないと思われる複数のデータ群を紐付けする必要がある。B2B2B領域でUnknown unknownsから脱するには複数データ群の分析しかないのである。

階層構造では拡散するB2B2Bの構造に対応した独自フレームワーク

 これら2つの課題点に対応しなければ、たとえばサプライチェーンマネジメントにおけるモノの流れを分析し、効率や効果を高めることはできない。そこで筆者は、ロジカルシンキングの考えをもとに、独自のフレームワークを考案した。「T字フレームワーク」と「逆T字フレームワーク」である。これらを使えば、部品のサプライチェーンという複数データ群の構造を分かりやすく可視化できる。

 T字フレームワークは、「部品と部品」の関係を表現するものだ(図2)。ある部品の上位部品と下位部品といったB2B2Bの構造を、その部品を複数メーカーが製造する場合も表せる。

図2:B2B2B構造を示すための「T字フレームワーク」。ここでは「部品と部品」「部品とメーカー」の関係を示している

 一方の逆T字フレームワークでは、「メーカーに対するバイヤーとサプライヤー」というB2B2B構造を表す(図3)。そのうえで、メーカーとメーカーの関係性を可視化し、メーカーが製造する複数の部品も表現できる。

図3:B2B2B構造を示すための「逆T字フレームワーク」。ここでは「メーカーとメーカー」「メーカーと部品」の関係を示している