- Column
- 学校では学べないデジタル時代のデータ分析法
メタ分析で隠れた真実をあぶり出す【第35回】
メタ分析事例2:新型コロナウイルス感染症(COVID-19)対策
新型コロナウイルス感染症(COVID-19)に関しては、さまざまデータや、その解釈が公開されている。
こちらもまず、第三者の分析結果を見てみると、「マスク着用」「アルコール消毒」「手洗い」「うがい」「握手を控える」「ソーシャルディスタンス」といった常識的な対策が多い。
それと科学的には解明されていないが、「BCGワクチン接種の有無」と「新型コロナウイルスの重症化」との関係性が指摘されている。確かに2つのデータを重ね合わせると、興味深い相関関係が見える。
オランダではすでに、ランダム化比較試験(RCT:Randomized Controlled Trial、第2回参照)を実施し、BCGワクチン接種をしたグループと接種していないグループに分けて、新型コロナウイルスとの関係を解明しようとしている。BCGワクチンには自然免疫を強化する機能も指摘されていて、ある程度の関係性は見える。これを筆者がメタ分析してみる。
「BCGワクチン接種」という原因、「新型コロナウイルスの重症化を抑える」という結果が、因果関係として即座に成り立つ訳ではない。第3の要因である交絡因子があり、それが原因になって、BCGワクチン接種と、新型コロナウイルスの重症化を抑えるという2つの結果があるほうが説明が成り立つ。この場合の交絡因子は、日本人の習慣や考え方にある“独自性”だ。
BCGワクチン接種は、日本人の考え方により1951年から法律によって定められている。和食や、土足禁止、火葬、宗教関連の集会頻度の少なさ、そして言葉の発音などの習慣から、新型コロナウイルスによる重症化に差が出ているという仮説も成り立つ。
海外と比較するうえでは、ウイルスについての検査方法の違い、検査件数の差、精度の視点から、感染者数の推定は難しい。目安になるのは、人口10万人当たりの死亡者数だ。欧米と日本では各段の差がある。日本で新型コロナウイルスに関係なく肺炎で死亡された方を組み入れたとしても、常識的な対策では、この差を説明できない。
日本で特徴的な要因の候補としては、メタ分析して分かった日本の風習(和食や土足禁止、火葬、花粉症などでマスクを着けることへの抵抗のなさなど)と、日本で流行ったウイルスの型の違い、BCG接種の有無などが挙げられる。ちなみに米国では、マスクは強盗が着けるイメージが強く敬遠する人もいれば、言論の自由を阻害する象徴がマスクだという人もいる。
なお、1918年8月から3年間にわたり猛威をふるったスペイン風邪の際にも、日本での致死率は世界に比べて1ケタ少なかった。
スペイン風邪では感染ピークの波が3回あった。その3回の波で日本では38万人以上が亡くなった。それを含め1918年に1年間の死亡者の数が、第二次世界大戦中を除き、過去最高の149万人を記録した。この数字は、2019年に138万人に至ったものの、戦時中以外では抜かされていない。
これら2事例のほか他にも、森友学園や、加計学園、検察庁法改正、持続化給付金といった話題の案件も、国家予算や議事録などのオープンデータ/プレオープンデータを使えばデータ分析やメタ分析の対象になる。
データの“動き”のみのほうが真実に近づくこともある
筆者が、本格的な生データを対象にした分析と出会ったのは、30年も前のことである。某金融機関の夜間バッチ処理において、ある国だけが他の国と比べて格段に遅いという問題の解消だった。解決までに半年もかかってしまったが、すべての可能性を考え、それらを1つひとつ潰していった経験は貴重である。
問題を解決できなかった前任者が残した分析結果をさらに分析し、関連のあるすべてのIT機器の専門家も分析したが、なかなか解決しなかった。さまざまな専門家が分析した結果に対し、あり得ないような独自の仮説を加えるというメタ分析によって、問題が解決できたのだ。
データ分析の対象として、関心が高い半面、難易度も高いのが株価分析だ。表に出ているデータだけでは太刀打ちできない。たとえば、米国の医療保険最大手のUnited Health Groupの株価が2019年4月16日から17日にかけて急落した。16日には四半期決算で予想を上回る好業績を発表したにもかかわらずだ。
株価は、一企業の事情だけではなく、業界そのもの、その裏にあるトレンド、国民心理など複雑な要素が絡み合って影響する。ヘルスケア産業は米国経済の5分の1にもなるが、国民皆保険への動きが激震を引き起こしている。
それだけに専門家でも株価の予測は、なかなかに困難だ。逆に、株価の流れを意識せず、データの“動き”という物理学的な要素のみで見た方が真実に近づくケースもある。加えて、複数人の専門家が分析した結果をメタ分析することも必要だろう。
そうした場合の課題解決へのアプローチ法は2つある。1つは、経験値から大きな範囲を定めて少しずつ狭めていく方法。もう1つは、先入観を持たず限られたポイントから始めて範囲を少しずつ広げていく方法である。
データの裏に潜むデータ、事実の裏に潜む真実
2019年の厚生労働省による統計不正問題で白日の下にさらされたように「統計」という専門性が国を上げて軽視されている。2014年の公務員制度改革により官邸が官僚の人事権を握ってからは“忖度”がまかり通っている。統計は客観的でなければならず、都合の良い忖度の道具にしてはならない。
なぜなら、データの裏に潜むデータを探るのに、最初のデータに嘘があっては、データと、その分析結果を元にメタ分析をいくら実施しても真実には決してたどり着かないからだ。
事実をつかむには客観性が不可欠であり、それを支えるのが統計である。そこに経験を持つ人の主観性を加えて推論することで真実に近づくことができる。それだけに、事実の裏に潜む真実をつかむには、やはり“信頼性”がキーワードになる。信頼性のあるデータについては、第14回で説明しているので参考にしていただきたい。
次回は、データ分析で役立つ心理学との類似点を説明したい。効果的な分析に向けた実践的なノウハウの1つである。
入江 宏志(いりえ・ひろし)
DACコンサルティング 代表、コンサルタント。データ分析から、クラウド、ビッグデータ、オープンデータ、GRC、次世代情報システムやデータセンター、人工知能など幅広い領域を対象に、新ビジネスモデル、アプリケーション、ITインフラ、データの4つの観点からコンサルティング活動に携わる。34年間のIT業界の経験として、第4世代言語の開発者を経て、IBM、Oracle、Dimension Data、Protivitiで首尾一貫して最新技術エリアを担当。2017年にデータ分析やコンサルテーションを手がけるDAC(Data, Analytics and Competitive Intelligence)コンサルティングを立ち上げた。
ヒト・モノ・カネに関するデータ分析を手がけ、退職者傾向分析、金融機関での商流分析、部品可視化、ヘルスケアに関する分析、サービスデザイン思考などの実績がある。国家予算などオープンデータを活用したビジネスも開発・推進する。海外を含めたIT新潮流に関する市場分析やデータ分析ノウハウに関した人材育成にも携わっている。