- Column
- 学校では学べないデジタル時代のデータ分析法
ビッグデータの法則:その3=数字の魔力【第22回】
数字の魔力7:ネイピア数(ℯ)
最適停止問題として知られる次のような問題がある。
秘書問題:面接で秘書を1人採用したい。応募者は100人いる。面接を丁寧にすれば良い人が見つかる。ただし面接ばかりしていると全員が終わるまでに時間がかかってしまい、早い時点に面接した人を逃がしてしまう。どこで決断すればよいか?
この問題を解く方法の1つにネイピア数を使う方法がある。ネイピア数とは、通常「ℯ」と表記させる定数で、「2.718・・・」という無理数である。
ネイピア数による答え: 応募者数を「n」とすれば、( n / ℯ )人までは採用しない。( n / ℯ )人で貯めたデータを元に、( n / ℯ ) + 1人目以降で( n / ℯ ) 人の誰よりも良い応募者が現れれば即採用する。
実際に数字を入れてもみよう。応募者が100人なら、100 / ℯ は「36.78・・・」だから、37人目までは不採用にしてデータを集め、38人以降で、それまでよりも良い応募者がでれば即決すればよい。ほかにも、アパート探しやお見合いによる結婚相手を決めるなどに有効とされる。
1 / ℯ は「0.3678・・・」、つまり約37%のデータがあれば十分で、あまりにデータを取り過ぎても駄目ということなのだろう。古代ギリシアの哲学者アリストテレスが挙げた「中庸(メソテース)」という考え方が、データ分析でも大切だ。「過ぎたるは及ばざるがごとし」という諺もある。実ビジネスでデータをどこまで取るかという場合、「37%」も貴重な数字と言えよう。
第19回で述べたが、スパースモデリングでは20%程度でデータ全体を創造できる。経験的に言えば、モノを対象にした分析では全体の20%程度、人の場合は全体の37%程度のデータを取れば全体を推定できると考える。ただし、真実につながる肝は、モノで5%、人なら0.1%程度のデータで概ねが決まってしまうことは避けられない。
何事も事前に十分に分析し自らに合致するものを創造せよ
これらのほかにも、暗号における素数のように、数字は世の中で重要な役割を果たしている。歴史を振り返ると、古代ギリシアのピタゴラスは「万物の根源は数である」と言ったとされる。現象には一定の法則があり、その法則は数字で表せるという意味だ。ITの世界でも、1965年に「ムーアの法則(半導体の集積度は18カ月で2倍に増える)」が、2000年には「ギルダーの法則(通信網の帯域幅は6カ月で2倍の早さで拡大する)」が提唱されている。
実際の分析でも法則は、とても役に立つ。ベンフォードの法則や、モンモール数、黄金比、白銀比といったビジネスで役立つ数字や法則を、いかにデータ分析で見つけるかがビジネス成否の鍵になる。
昔から日本では、情報に頼らず、ぶっつけ本番で戦うほうがかっこ良く、事前に調べることは卑怯だと思われる節があった。その傾向は現在も残っていて、分析を苦手とするばかりか、毛嫌いする人も少なくない。結果、自ら新しいものを創造せず、グローバル化に対応するといいながら、「日本型」「日本版」の冠を付けて日本には合わない海外の制度の模倣品を作りだしてしまうのだ。
何事も事前に十分に分析し、自らに合致する新たなものを創造しなければならない。その際に役立つのが「ビッグデータの法則」である。国レベルで統計を取っても、自らに都合の良いように身内からデータを取得したり、歪に加工したりと信頼度があまりにも低い。統計不正に対処し嘘を見ぬくには、公表された結果を鵜呑みにせず、さまざまな法則や自分の価値観に照らして、自ら判断したほうが良い。
次回は、もう1つの「ビッグデータの法則」である「広がる格差」について説明する。
入江 宏志(いりえ・ひろし)
DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。
ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。