• Column
  • DX時代に不可欠なデータリテラシー入門

データを使う力を高める=シグナルとノイズ編【第4回】

濱野 正樹(クリックテック・ジャパン ソリューション技術部 部長)
2020年9月29日

データ分析に取り組むに当たり、誰もが求められるデータリテラシー。第2回からデータリテラシーを構成する4つの力を高めるのに必要な基本的な知識を解説しています。今回と次回は、「データを使う力」についてです。まずは、使う力の鍵になる重要な概念である「シグナルとノイズ」について説明します。

 私たちの周囲には、膨大な情報が溢れています。ただ、その中には必要ではない情報も含まれているのも事実です。膨大な情報ののなかにある「シグナル」と「ノイズ」を正しく理解することは、データを使うためには最も基本的であり不可欠です。

膨大なノイズに埋もれたシグナルを見極める

 初めに「シグナル」と「ノイズ」を定義しておきましょう。シグナルとは「膨大な情報の中にある利用したい情報」を表します。ノイズは「関連情報から逸脱する、その他すべての情報」です。

 私たちの周囲にあふれる多くの情報の、すべてが重要な情報とは限りません。むしろ重要ではない、場合によっては捏造されたデータもあります。洞察に結び付く重要な情報は、そうした重要ではないノイズの中に潜んでいるのです。多数の石の中から宝石の原石を見つけるようなイメージかもしれません。

 たとえば病院の診察なら、患者さんがどのような交通手段で来院したのかは、医師にとってはノイズに入るでしょう。シグナルになるのは患者のどこに問題があるのか、どのような治療をすべきか、などにつながる情報です。

 一方で、来院者に向けたサービスを担当している部門では、患者の来院手段は考慮すべきシグナルです。自転車での来院が多いなら、駐輪場の拡張を考える必要があるかもしれません。分析の目的や場面に応じて、戦略や目標に近づくのに役立つシグナルを探すことが重要です。

シグナルを見極めるための4つの観点

 シグナルを見極めるには、(1)何を求めているのか、(2)バイアスを捨てる、(3)懐疑的に見る、(4)「なぜ」と問いかける、の4つの観点があります(図1)。

図1:シグナルを見極めるための4つの観点

観点1:何を求めているのか

 データの中から何を探そうとしているのか、目標と戦略を正しく理解する必要があります。求めているものを理解できればデータ活用は正しい方向に進みます。

観点2:バイアスを捨てる

 誰しも、経験や知識から何らかのバイアス(偏見や先入観)を持っています。バイアスはデータを客観的に見ることを妨げ、判断を鈍らせる危険があります。正しい答えを導き出すために、バイアスとなる思考を極力排除しましょう。

観点3:懐疑的に見る

 常に疑問を抱くようにしてください。「なぜこのような数字になるのか」「これは本当に自分が求めているものに対する答えとなるのか」と常に疑いを持ちながらデータに接してください。

観点4:「なぜ」と問いかける

 常に「なぜ」と理由を問いかけ、データや数字の背後に何があるかに目を向けてください。データや数字に表れた意味を掘り下げて考えると、目的に結びついてきます。