• Column
  • DX時代に不可欠なデータリテラシー入門

データを使う力を高める=シグナルとノイズ編【第4回】

濱野 正樹(クリックテック・ジャパン ソリューション技術部 部長)
2020年9月29日

特定のデータだけを見ていてもシグナルは見極められない

 シグナルを見極めるための4つの観点は“言うは易し行うは難し”で、具体的にどうすれば良いのかは、なかなかイメージしづらいかもしれません。もう少し具体的に理解していただくために、レストランの口コミサイトを例に考えてみましょう。

 今からあなたは、口コミサイトの運営者で、毎年実施している表彰制度の人気店を決める担当者です。店舗の訪問客から口コミサイトに寄せられたレビューやコメントを分析し、どのレストランが表彰に値するかの判断材料にしようとしています。しかし、口コミサイトの評価は玉石混淆でノイズに満ちています。ノイズの海から真の評価につながるシグナルを探していかねばなりません。

 たとえばコメントには、「サービスは手際よく、親近感が持てるスタッフたちでした」という高評価のものもあれば、「店のサービスはひどく、料理は冷めていました」という辛辣なものもあります。料理の評価も「最高においしかった」や「料理はひどかったが、デザートは驚くほどおいしかった」などに分かれています(図2)。どのコメントが、あなたが探している答えを導き出してくれるのでしょうか。

図2:口コミサイトの評判は玉石混淆。多くのノイズの中から、レストランの評価につながるシグナルを見つける

 正しい答えを導き出すため、4つの観点を思い出してみましょう。まず観点1の「何を求めているのか」は、顧客から本当に評価されているレストランを探し出すことです。

 その際、あなた自身に観点2の「バイアス」はないでしょうか。誰しも食事に好みがあります。生まれ育った家でよく食べた料理や、誕生日や結婚式など特別な機会に提供された料理、久しぶりに訪ねたのに臨時休業でがっかりした経験など、個人的な体験に伴う感情は記憶に無意識に刻まれます。自分や親しい人が働いた経験があるレストランならば、愛着が蓄積されていることでしょう。

 こうした経験や記憶はバイアスを作り出す可能性があり、判断を鈍らせるかもしれません。バイアスを排除し、客観的に見るように心がける必要があります。

 そのうえで情報は観点3の「懐疑的」で見ていきましょう。なぜ投稿者は評価やコメントを残したのでしょうか。本当においしくて感激した、逆に期待を裏切られて落胆したなど、経験に伴う強い感情を誰かに伝えようとしているのでしょうか。大半はそうかもしれませんが、中には店主から何らかのインセンティブを与えられた結果かもしれませんし、身内あるいは店主自身が書いているかもしれません。「やらせ」や「さくら」は、ネットでは容易にできるのです。

 これらを判断するには、コメントを寄せた人が普段どんな店に書き込んでいるのか、どんな評価をしているのか、といった傾向を見てもいいかもしれません。開店したばかりのレストランに辛辣な評価を寄せている人が、ライバル店には好意的なコメントを多数の寄せていたとすれば、その人のコメントを信じて良いのでしょうか。ライバル店の関係者かもしれません。逆に、普段から、どの店にも辛辣な評価を寄せている人が時折与える高い評価は、シグナルと考えていいかもしれません。

 最後に観点4の「なぜ」を考えましょう。満足している顧客はなぜ満足できたのか、「二度と来ない」とコメントを残した顧客に何があったのか。これらは、「たまたま」偶然が重なったのか、「ほとんど」の顧客が思うことなのか、全体の傾向を見ましょう。もし特定の期間だけ評価の傾向が高まったり、逆に低くなったりしていれば、スタッフの入れ替えや食材の仕入れ先の変更など、何らかの要因があったのかもしれません。

 コメントだけから、すべてを知ることは難しいでしょう。それでも、存在するレビューやコメントの背後に何があるのかを考えましょう。対象のレストランのコメントだけを見ていても判断はできません。考えるべきことは多数ありますが、ポイントを押さえていけば、より真実に近づけます。

シグナルが歪む原因は、あなた自身かもしれない

 シグナルとノイズについて説明しましたが、データ活用に取り組み始めたばかりであれば、往々にしてシグナルを見極める4つの観点を十分踏まえずに答えを導き出してしまうでしょう。経験を積んだあとでも、同種の分析を繰り返していると前回の答えがバイアスになることもあります。シグナルが歪む原因は、あなた自身かもしれないことを常に意識してください。

 次回は、「使う力」にとって、とても重要な「相関関係と因果関係」について説明します。

 なお本連載は、データ活用のためのオンライン学習プラットフォーム「データリテラシープロジェクト」が提供する動画コンテンツを参考に構成しています。動画も併せてご活用ください。

濱野 正樹(はまの・まさき)

クリックテック・ジャパン ソリューション技術部 部長。2014年2月クリックテック・ジャパン入社。Qlik製品の大規模エンタープライズ提案やプロジェクトを支援するとともに、各種カンファレンスやコミュニティサイトなどを通じて技術情報を発信している。日本IBM株式会社でハードウェア製品やデータ統合製品の技術を担当。プログレス・テクノロジーズ株式会社でのテクノロジー・センター長としての技術組織のマネジメントや、IMS Japan株式会社(現IQVIAソリューションズジャパン株式会社)での大手製薬企業向けグローバルBI/DWHシステム構築のプロジェクトマネージャーなどを歴任。筑波大学MBA(International Business)修了。