• Column
  • 学校では学べないデジタル時代のデータ分析法

ビッグデータの法則:その3=数字の魔力【第22回】

入江 宏志(DACコンサルティング代表)
2019年6月24日

数字の魔力4:白銀比(1:√2 ≒ 1:1.414)

 長方形の長辺を中点で2分割してできた長方形が、元々の長方形と相似であるようにした場合、その辺の比が「白銀比」になる(図3)。

図3:白銀比。相似箇所にも気付きの発見がある

 A4判、A5判など用紙の縦横比は白銀比になっている。キティちゃんの顔の縦横も白銀比だと言われているし、菱川 師宣の見返り美人図も人物で白銀比が見られる。日本の美術や建造物で用いられることが多いことから、白銀比は日本人の感性に合うと言われるが、その証拠となる確固としたデータがないのが現状だ。

 全体と、その一部が相似というパターンは、フラクタル(全体と部分が相似関係にある)でも出てくるが、データ分析において“相似”は1つのヒントになる。ある領域の分析で、すでに事実が見つかっていれば、相似の箇所にも必ず発見があるからだ。しかし、他の箇所での分析で気付きがなければ、その相似の箇所にも概ね気付きはない。

 第15回で「データの美」を述べた。自然界には、対称性が高く調和のとれた幾何学的な模様を生み出す“美”が存在する。雪の結晶や、冠のような水滴、水の波紋、ハチの巣、リアス式海岸、葉脈などだ。リアス式海岸などが持つフラクタルは美の象徴でもある。自然界の至る所で見られるこれら現象をデータ分析の分野に取り入れた新しいデータ構造や分析手法も必要になるだろう。

数字の魔力5:完全数

 ある数字の約数をすべて足すと、その数字になる数が「完全数」である。たとえば、「6」の約数は「1、2、3」だが、これらを足す(1+2+3)と6になる。6は完全数である。6以降の完全数には、28、496、8128がある。人類や宇宙にとって意味のある数字とされ、超弦理論(超ひも理論とも言う)でも、496は意味のある数字になっている。

 統計学や数学を用いて分析していくと、分析結果が完全数に近付くことがある。安定する数を知ることは予測で役に立つ。第18回では「6年カレンダー」について、第19回ではIT産業において中心となる企業数として「6」を説明した。「6」という完全数は、身の回りのサイクル(小学校6年、中高6年、大学・大学院6年)とも密接である。暦注の1つに六曜があるが、これも大安・仏滅・先勝・先負・赤口・友引の6つのサイクルからなっている。

 基本のサイクルを「6」にしてみても良いだろう。何か試すのも6回、全体からサンプルを取るのも6個あるいは6%、何か行うなら毎月6日、ディスカッションする人数も6人などだ。雪の結晶やハチの巣も六角形で安定し、正六面体も身近に満ちあふれている。心理的にもアンガー・マネジメントで怒りを鎮めるために1から6までを数える方法があるのも、怒りのピークが6秒だからだ。

 地球レベルの話では、過去に地球上の生命は「ビッグファイブ」と呼ばれる5回の大絶滅を経験している。次は6度目の大絶滅(Sixth Extinction)においては人類は生き延びられない可能性もあるという。完全数は重要な意味を持っている。

数字の魔力6:「78:22」の法則

 空気の窒素含有率は78%で、体内の善玉菌と悪玉菌の比率は「78:22」だと言われている。富裕層が占める資産も全体の概ね78%という説が存在する。分析において、ある仮説を立てる場合、この「78:22」の法則に沿って計算することがある。経験もなく、根拠が何もないところから仮説を作るには、何かしらの法則に頼るほうが効率がいい。

 たとえばベイズ推定で事前確率を作る際、とりあえず仮の確率を使って計算することが認められている。これを「理由不十分の原則」という。そこで確率が全く分らない場合、等確率、つまり選択肢が2つならば50%、3つならば33%と考えるように教科書に書かれている。この方法も有効ではあるが、筆者は「78:22」の法則を使って検証することがある。

 具体的には、迷惑メールが届く確率をベイズ推定で解く場合、受信するメールの中で正常メールが78%、迷惑メールが22%と事前確率を決めて推論していくのだ。経験値から主観的に決めても良いが、このような目安も必要になる。

 なお金融機関に行くと、「72の法則」という話を聞くことがあるかもしれない。金融機関に預けた元本が2倍になるような年利と年数を簡易的に計算する方法である。全くの別物ではあるが、数字を使った法則はさまざまな業界で利用されている。