- Column
- データ駆動型経営が求める商品マスターの作り方
データの生成・加工における「1:N」問題とAI技術の解決力【第4回】
既存データの加工と新規データの生成とが求められる
商品データの生成・加工には、大きく分けて二つのパターンがあります。
パターン1:既存の商品データを加工する
●商品説明文の調整:文字数を長くする/短くする、ターゲット層に合わせて文章のテイスト(丁寧語、若者向け、専門的など)を変える、特定のキーワードを含めるように書き換える
●情報の抽出・変換:長い商品説明文から重要なスペック情報を抽出する、サイズ表記の単位を統一する(センチメートルをミリメートルに統一するなど)、色情報を標準化する(ワインレッドとラズベリーを赤にまとめるなど)
パターン2:これまでにない項目を追加する
●EC用商品名の作成: SEOや検索性を考慮した、キャッチーな商品名を新たに作る
●分析用カラムの作成: 特定の分析軸(健康志向や時短など)に基づいたフラグやカテゴリーを付与する。
●特徴タグの生成:商品が持つ、さまざまな特徴(素材、機能、効果、利用シーン、テイストなど)をキーワード化し、タグとして複数生成する
●レコメンデーション用情報の生成: 関連性の高い商品を紐付けるための情報を生成する
これらの作業は、商品数が少なければまだしも、数千、数万、それ以上の商品数を扱う企業にとっては、まさに“気合と根性”の世界になります。しかし、人的リソースには限りがあり、入力ミスや表記揺れのリスクも常に伴います。結果、データ活用のボトルネックになり、施策の実行スピードを鈍化させ、機会損失につながるケースも少なくありません。
この状況を打破する鍵として近年、急速に進化し期待が高まっているのがAI技術です。特に、自然言語処理(NLP)や画像認識、生成AIといった技術の発展により、これまで人手に頼らざるを得なかった商品データの生成・加工プロセスを、高速かつ高精度に自動化できるようになってきました。
AI技術は、次のような形で商品データの生成・加工を支援します。
●文章生成・要約・校正:商品説明文の生成、長文の要約、文字数制限に合わせた調整、文章テイストの変換、誤字脱字のチェックなどを実行する
●特徴抽出・タグ付け: 商品名、商品説明文、スペック情報、さらには商品画像などから商品の特徴を読み取り、適切なカテゴリー分類やキーワードタグを付与する
●情報付与(エンリッチメント): 既存のデータだけでは不足している情報を、外部データベースやWeb上の情報などを参照しながら補完・付与する
●データ形式の変換・標準化: システムごとに異なるフォーマットへのデータ変換や、表記揺れの統一などを実行する
例えば当社が提供するPDP(Product Data Platform)の「Lazuli PDP」でも、AI技術を活用した商品データの生成・加工機能を用意しています。そうした機能を利用することで、ECサイトへの商品登録時間の7割以上の削減や、データ分析における属人的な業務時間を大幅に削減、EC用商品データの充実によるコンバージョンレートの大幅な改善と売り上げ・利益の向上といった成果が得られます。
AI技術の活用でコストセンターから脱却を
商品データの生成・加工といった整備プロセスは、データ活用の成否を分ける重要なステップです。にもかかわらず、これまでは「コストセンター」と見なされがちでした。各システムやツールの仕様に合わせてデータを整える作業は、多大な人的リソースと時間を必要としてきたからです。
その常識はAI技術の進化によって変わりつつあります。大量の商品データであっても、多様な形式へ高速かつ高精度に生成・加工できるようになってきているからです。企業は、データの整備プロセスにかける時間とコストを削減しながら、本来注力すべきデータ分析や各種施策の実行にリソースを集中させることができます。商品データの生成・加工というボトルネックの解消においてAI技術の活用はもはや避けて通れないと言えるでしょう。
次回は、商品データを活用した具体的な施策や、その先にある可能性について解説します。
池内 優嗣(いけうち・ゆうじ)
Lazuli COO(Chief Operation Officer:最高執行責任者)。2003年リクルート入社。営業、マーケティングを経験の後、デジタルマーケティングを全社横断で統括する組織にて各事業のグロースを支える。2013年より三井物産ヘルスケア事業本部で事業開発、M&Aに従事。FRONTEO 社長室勤務を経て、2020年にLazuliを萩原静厳と共同創業。2003年東京大学文学部歴史文化学科美術史学専修課程 修了、2013年MBA(Trinity College Dublin)取得。