• Column
  • 学校では学べないデジタル時代のデータ分析法

データが持つ“重力”を活用するために乗り越えるべき3つの壁【第16回】

入江 宏志(DACコンサルティング代表)
2018年12月25日

ここ数回、データ分析における心理的側面や、リスク管理の必要性、そして数学的・科学的な手法を生かすためのセンスなどを紹介してきた。今回からは、データ分析の本来の目的である「データをいかにビジネスに結び付けるか」について述べる。今回は、データの性質の一つである「データ重力」を紹介し、それを活用する際に直面する「3つの壁」の乗り越え方を考えてみたい。

 前回、数学的・科学的手法についてみてきたが、そもそも数学を使わない産業を見つけるほうが難しい。保険業界では、保険料の算出からリスク把握に至るまで幅広く回帰分析などを駆使する。製造業では、微積分や線形代数などを使って現場での歩留まりを向上させている。

 IT業界なら、検索エンジンの礎として行列の固有値が欠かせないし、セキュリティの世界では整数論により、より安全な暗号の実現を目指している。コンピューター自体、数学で成り立っているのだから当然である。すべてのビジネスの基本は、アルゴリズムとデータだと言える。

データの“重力”にビジネスが引きつけられる

 データ分析はビジネスに不可欠であり、それ自体も1つのビジネスになっている。さらに、データそのものも売買の対象であり「データビジネス」も存在する。ビジネスで利用される「Trusted Data(信頼できるデータ)」を売る仕事は、古くからあるデータビジネスだ。新しいデータカテゴリーである「Open Data(自由に利用できるデータ)」も、それを加工して付加価値をつければ売り物になる。

 データに対しては「データ重力(Data Gravity)」という言葉がある。「データは質量を持っていて重力が発生する」という、万有引力になぞらえた考え方だ。データが蓄積されると惑星のように重力が発生し、アプリケーションやサービスといったIT資産がデータに引き付けられるように発生する現象をとらえている。

 たとえば、書籍のネット販売から始めた米Amazon.comが、ネット通販のデータを大量に集め、扱う商品が広がり、クラウドビジネスへ参入し、そこから、さらに、さまざまなビジネスモデルを生み出している。データが存在する方向にIT資産が引きずられ、ビジネスモデルもデータの方向に引っ張られる好例だろう。

 しかし、データをビジネスで使いこなすために、避けて通れない3つの壁がある。

壁1:意味あるデータはどこから取ってくるか?
壁2:そもそもビッグデータをすべて取得することは必要なのか?
壁3:どのデータに価値があるか?

 それぞれの意味と乗り越え方を見てこう。

壁1:意味あるデータはどこから取ってくるか?

 筆者は、本連載のようなデータ分析法を執筆するほか、企業向けにデータ分析法の有償セミナーも手がけている。そうしたセミナーで最も多い質問が「データをどこから持ってくるか?」だ。

 世の中のデータは、(1)ある程度信頼性の高いTrusted Data、(2)フェイクニュースも含む自由闊達な領域の「Any Data(さまざまなデータ)」、(3)国や地方公共団体などが経済活性化のために提供するOpen Dataに大別できる(図1)。ビッグデータで気付きを得るには、違う分野の複数データを紐付けることが必須だ。その点、これまで公開されることが少なかったOpen Dataは大切である。

図1:世の中に存在するデータの種類

 それ以上に筆者が魅力を感じるデータに、Open Dataの基として公開されている、より生に近い「Pre-Open Data」がある。たとえば、省庁が出しているOpen Dataと銘打たれたデータより、予算・決算・予算執行など係る情報のほうが役立つ場合がある。

 同様に、社内でも、これまで分析されてこなかった「Alternative Data(公開していない非伝統的なデータ)」も威力を発揮する。外部に出せないAlternative Dataを分析するには、社内にデータ分析の人材を置くことがリスク管理になる。

 Trusted Dataや、Any Data、Open Dataのそれぞれにおいて、自分にとって役に立つネット上の複数サイトや、アナログかデジタルかにかかわらず生データを押さえておき、継続的にアクセスすれば、特徴が見つかる。そこから複数のデータ群を自由自在に紐付け、データ分析用のオリジナルな辞書を作成する。AI(人工知能)の学習で利用する教師データを用意するようなものだ。そうすればデータを魅力的で意味あるものに変えられる。