- Column
- 大和敏彦のデジタル未来予測
EUの「GDPR(一般データ保護法)」が示すデータの光と影【第19回】
収集するデータのデザインがデータの価値を決める
Googleは多くのサービスを提供している。検索やMap、Gmail、カレンダー、Documents、YouTubeなどだ。そのサービスごとに膨大なデータを収集している。一体どのようなデータを収集しているのかを見てみよう。
Google検索では、検索結果とヒットしたデータの数といった検索に関するデータのほかに、検索を実行したユーザーの情報などが収集されている(図1)。これらのデータを基に個人の嗜好や行動パターンを推測し、それを広告につなげる。特定の場所や時間に集中した検索データから、その場所でのイベントを推測するなどのデータ活用も可能になる。
Gmailでは、メールの全メッセージが収集されている。そのメッセージを解析することによって、行動やメッセージ交換の相手に関する情報が得られる。
それぞれのデータを用いたサービス間連携も図られている。たとえば、ホテルをネットで予約し、その確認メールをGmailで受け取ると、ホテルの場所や宿泊日時がGoogle MapやGoogle Calendarなどに反映される。
これらのデータ項目を見てみると、サービス開始の際に、どのようなデータの収集をすべきか、どのようなデータが同時に収集可能かを検討することの重要性がわかる。Google検索の例をみても、検索の精度や品質などサービス品質の向上に役立てたり、ユーザーの特性や行動パターンの推測に利用したりと、より広い分析や他データとの連携に活用可能になっている。
つまり、収集するデータのデザインが、データの価値を決めるのだ。この点では、既にあるデータの活用には限界がある。特定の目的のために収集済みのデータでは、内容や精度、他のデータとの連携などにおいて、キーの不足といった問題が生じる可能性がある。
スマホアプリや情報漏えいによって個人情報が勝手に活用される
中国でも積極的なデータ活用が進んでいる。『中国アリババのFintechにみるデータの高度活用法【第8回】』で述べたように、支払い情報を店舗紹介やマーケティングに活用するだけでなく、ペイメント情報や、クレジットの支払い履歴、交友関係のデータと連携することで「信用スコア」をつけ、信用スコアサービスとして提供している。信用スコアは、サービス利用や購買など、さまざまな場面での信用判断に使われている。
最近話題になったデータ活用例に、河北省石家荘市の裁判所である河北省高級人民法院が開発した「ラオライ・マップ(老頼地図)」という地図アプリがある。中国Tencentが提供するチャットアプリ「WeChat」の付加機能として提供され、誰でもが、半径500メートル以内に存在する借金を滞納している個人や会社組織の代表者などを地図上に表示できる。
老頼地図は、個人情報が不特定多数に見られてしまう仕組みだ。これがブラックリストになり、滞納者は航空券の購入やリゾート地での滞在、不動産の購入などで制限を受ける。データ活用に対する規制がなければ、老頼地図のように、さまざまな活用が勝手に実行され、即座に広がっていくことになる。