• Column
  • 学校では学べないデジタル時代のデータ分析法

時系列の分析で新たな意味を見いだせるメタデータの価値【第34回】

入江 宏志(DACコンサルティング代表)
2020年5月25日

第25回で「メタデータ(metadata)」を紹介した。あるデータが付随して持つ、そのデータ自身に関する付加的なデータである。広義には、あるデータをもとに分析した結果も、そのデータに付随するメタデータになる。単なるメタデータからは深い意味は見いだせないが、このメタデータを時系列で持つと予想外のパワーを発揮する。実例を示しながら、メタデータが持つ価値を説明する。

 最近、データ分析において活用例が増えているデータに、テキスト、クレジットカード番号、位置データの3つがある。これらは「オルタナティブ・データ」と呼ばれる(第8回参照)。伝統的ではないデータの総称だ。狭義には「新しく発生するデータ」を指すが、広義には「今まで使われなかったデータ」も意味する。

 オルタナティブ・データの解析では、各々のデータの分析結果も重要だが、分析した結果の変化を見ることが、より有効な結果を導き出せる。たとえば、各国中央銀行総裁の発言というテキストデータを分析することで、その時点での動向がわかるが、そのメタデータ(metadata)を時系列に追っていけば、今後どうなるかを予測できる。

 メタデータとは、メタなデータ、つまりデータに関するデータという意味だ。あるデータが付随して持つそのデータ自身についての付加的なデータを指す(図1)。メタデータの生命線は“変化”である。すなわち、あるデータをもとに分析した結果である広義のメタデータを時系列に保存し分析することが重要だ。

図1:「メタデータ」はデータに付帯するデータ

メタデータの分析でビジネスの将来性を予見

 メタデータの時系列分析の実例を筆者自身の経験から紹介しよう。以下の例で一番言いたいのは、分析をしたら独自で良いので、自らが納得できるようにモデル化し、グラフやフレームワークなどに仕上げていく必要があることだ。それが問題を解くアルゴリズムになっていく。そこから未来を予測し、事前に準備し、ビジネスに活かしていく。そうでなければ分析に意味はない。その点に留意して事例を追っていただきたい。

 筆者は、2000年以前から、さまざまなメタデータを分析し、その結果を時系列で保存してきた。

 たとえば、インターネットがビジネスで使われ始めたのは1996年であり、各業界で活用され始めたのが2001年だ。その際、インターネットのサイトで有名なトップ100が公開されている。書店、旅行、通販、自動車、家電、コンピューター、チケット販売、ネットスーパー、電子書籍、音楽配信、証券、モール、ゲーム、AV(オーディオ・ビジュアル)、食事、文具、家具、決済の18カテゴリーだった。

 トップ100のサイトについて、インターネット上のWebサーバーや基本ソフトウェア(OS)などを調査している「Netcraft(https://www.netcraft.com/)」を使って毎年、(1)OSの種類、(2)サーバーソフトウエアの種類、(3)データセンター(Hosting company)を調べてきた。単に調べたいサイトのURLを入力するだけである(図2)。

図2:Netcraftの活用例

 ある時点での、これらのデータは小さな価値しかない。だがこれらを時系列で記録、もしくは業界ごとに分類すれば価値が出てくる。「2000年代前半は、旅行業界はLinux、通販は米IBM製ソフトウェアを使う傾向がある」といった業界ごとに明確な類似点があり、それは複次的な視点でビジネスに活用できる。

 実際、ある時、ネットビジネスで有名な社長に、上記のトップ100を複数年に渡ってまとめたメタデータのリストを見せたところ、その社長は「そのメタデータを売ってほしい」と言ってきた。ネット通販が世の中で主流ではなく、米Amazon.comもまだ洋書を扱う程度の存在だった頃に、メタデータを分析することでさまざまな業界、たとえばネット通販の将来性を予見できたためである。

 つまりビジネスが拡大していくかどうかは、OSやサーバー用ソフトウェアの選択と関係性がある。その黄金律を時系列分析で見抜いていけば将来を見通せる。さらに、同じデータセンターを使うユーザー企業同士が協業する場合も少なくないため、どこのデータセンターを使っているかも分析の指標になる。

 この例では、URLというデータに付随する最新の属性情報(上記のOSやサーバーソフトウェアの種類など)だけがメタデータではなく、その属性が時系列でどう変化するかもまたメタデータである。“最新”と“変化”の両方があって初めて価値が出る。

 上記社長とのやり取りでは、「無償で得たデータも工夫すれば売れるのだ」と実感したことをよく覚えている。現在、データ分析を仕事とし、新たな価値を探し続けているのは、その際の経験に基づいているからだ。