• Column
  • データ駆動型経営が求める商品マスターの作り方

商品データの整備で実際に起きている問題【第2回】

池内 優嗣(Lazuli COO)
2025年3月10日

データ分析担当者が直面している課題

 DXへの取り組みにおいて、データ分析は現代企業の経営戦略の中核に位置付けられています。冒頭に述べた通り、そこには当然、商品データが含まれることも多く、売り上げの推移やトレンド分析にとどまらず、AI(人工知能)技術を使った需要予測や在庫の最適化など、データの重要性は高まる一方です。

 しかし、データ分析に当たる担当者の多くが、その土台となる商品データの整備に関する課題に直面しています。最も重要な課題はデータの品質と一貫性であり、そこに規模とリソースの問題が加わります。

データ分析者の課題1:データ収集における構造的問題

 データ分析担当者が直面する最大の課題は、信頼性の高いデータを継続的に収集し、分析したい項目を生成/加工することです。例えば、清涼飲料水市場では月間100件以上の新商品が発売され、それぞれに20〜30項目のデータ入力が必要です。これだけでも月間2000〜3000件のデータポイントを毎回整備しなければなりません。

データ分析者の課題2:社内データの統合

 社内の各部署に分散して存在する商品データは、EC担当者の課題同様に“サイロ化”の状態にあり、分析に適した形式での統合が困難です。同じ商品に対し、店頭と工場で異なるIDが割り振られているというケースもあります。各部署が独自の形式でデータを管理しているため、分析用に加工する必要があります。

データ分析者の課題3:他社商品データの取り扱い

 分析精度を高めるためには、自社の商品データだけでなく、競合他社の商品データを含めた包括的な分析が不可欠です。しかし、さまざまなメーカーが継続的に新商品を投入する中、他社の情報を随時収集し、分析可能な形式に整備することは大きな負担です。

データ分析者の課題4:データ構造化の課題

 分析の目的に応じて、次のような項目を整備する必要があります。

・例えば大・中・小のカテゴリーに分けるような階層的な商品分類
・分析対象として注目したい特定の商品特性を示すフラグ。例えば「トクホ」「和」「ノンアル」「微アル」など
・商品の特徴を表すタグ。和風や食感などのキーワード

データ分析者の課題5:人的リソースの限界と現実的な対応

 上述したような大量データを人手で処理すれば、必然的に次の問題が発生します。

・表記の揺れ
・データ入力ミスの増加
・処理の遅延や分析の後れ

 筆者は、顧客が手作業で実施しているデータ整備業務の内容を把握するために、一緒に作業したことがありますが、やはりミスは起こりました。何より、その圧倒的なデータ入力項目数に打ちのめされました。データ整備に十分なリソースを継続的に確保できる企業は限られているのが実状であり、多くの企業は次のような状況に陥っています。

・一部、あるいは継続的なデータ整備を断念
・分析の範囲や精度を妥協
・重要な分析機会やAI技術の活用機会の逸失

取引先のデータを扱わざるを得ないことが課題を難しくしている

 EC担当者とデータ分析担当者の課題を挙げましたが、これらの根底にあるのは取引先のデータを扱わざるを得ないことです。小売業やSPA(Speciality store retailer of Private label Apparel:製造小売業)は日々、多数の取引先や工場から商品を仕入れています。商品情報は、発注書や指示書、企画書などとして提供されますが、各取引先が独自のフォーマットを使用しており、データ形式も大きく異なります。これを原因に次のような課題が発生しています。

データ統合における表記揺れの課題

 同じ情報であっても、取引先によって表記方法が異なるケースが頻発します。例えば、色の情報一つをとっても、以下のような、さまざまな表記が混在しています。

・「黄色」(日本語表記)
・「イエロー」(カタカナ表記)
・「YELLOW」(アルファベット全角)
・「yellow」(アルファベット小文字)

 アパレルでは「黒」を表すための単語が2000以上あるとも聞きます。

属人化による品質リスク

 データの統合・変換作業は多くの場合、担当者の経験と知識に依存する属人的な業務になっています。これにより以下の問題が生じています。

・担当者の異動や退職による業務品質の低下
・人的ミスの発生
・ナレッジの継承困難

データ活用の制限によるビジネスへの影響

 不統一なデータは以下のような重要な業務に支障をきたします。

・社内システムでの正確な在庫管理
・ECサイトでの商品情報展開
・店頭での販売分析(特に消費者が認識するカテゴリーや商品において)
・クロスセル施策の立案

データのサイロ化の深刻化

 取引先ごとに異なるデータ形式は、結果として社内データのサイロ化を助長します。EC担当者の課題でも指摘しましたが、以下のような問題が発生しています。

・部門間でのデータ共有の困難化
・全社的な分析・施策立案の遅延
・システム間連携の複雑化

 今回指摘したような商品データに伴う課題は、データドリブンな意思決定を目指す企業にとって深刻な課題です。効率的なデータ整備の仕組みを作ることは、今後の競争力維持・向上において重要な経営課題なのです。

池内 優嗣(いけうち・ゆうじ)

Lazuli COO(Chief Operation Officer:最高執行責任者)。2003年リクルート入社。営業、マーケティングを経験の後、デジタルマーケティングを全社横断で統括する組織にて各事業のグロースを支える。2013年より三井物産ヘルスケア事業本部で事業開発、M&Aに従事。FRONTEO 社長室勤務を経て、2020年にLazuliを萩原静厳と共同創業。2003年東京大学文学部歴史文化学科美術史学専修課程 修了、2013年MBA(Trinity College Dublin)取得。