- UseCase
- 製造
デンソー、文書の図表データを構造化してRAGの精度を高めるPoCを実施
デンソーは、社内外の文書を横断的に活用するAI(人工知能)基盤の高度化に向け、RAG(Retrieval-Augmented Generation:検索拡張生成)で利用する図表などの非構造化データを構造化データにするPoC(Proof of Concept:概念実証)を実施した。大規模言語モデル(LLM:Large Language Models)が解釈しやすい形式に整備し、社内データ検索におけるナレッジ活用の精度向上を図る。データ処理技術を提供したWanderlustが2026年4月6日に発表した。
デンソーは、社内外に蓄積された文書を横断的に参照し、業務で活用するAI(人工知能)基盤の開発に取り組んでいる。このほど、図表などの非構造化データを、RAG(Retrieval-Augmented Generation:検索拡張生成)で利用可能な構造化データに変換するPoC(Proof of Concept:概念実証)を実施した(図1)。大規模言語モデル(LLM:Large Language Models)が解釈しやすい「LLM Ready」なデータを整備し、データ検索によるナレッジ活用の精度を高めるのが目的だ。
PoCでは、資料内に含まれる種々の情報を統合的に処理する仕組みを構築した。構造化処理を施したデータ群は、未処理のデータと比較して回答の正確性および網羅性が向上することを定量的に確認した。
具体的には、文字情報を抽出するためのOCR(Optical Character Recognition:光学的文字認識)技術と、図表やグラフなどの画像内容を言語化するVLM(Vision Language Model:視覚言語モデル)を組み合わせたパイプラインを整備した。
変換後のデータは、MarkdownやJSON(JavaScript Object Notation)などの形式に変換し、検索や生成処理に適した形で蓄積する。さらに、抽出・変換したデータの解釈精度を高めるため、自社のデータ特性に適合するようにプロンプト(指示文)側の最適化も加えた。
今回の結果を受け今後は、データ整備の取り組みを社内の各業務領域へ拡大し、ナレッジ活用の高度化を進める。
PoCの環境には、AIエージェント実行基盤「Copilot Studio」(米Microsoft製)を採用した。非構造化データ処理に関する技術提供は、AI開発支援を手掛ける東大発スタートアップのWanderlustが担った。
Wanderlustによると近年、企業は社内ナレッジの活用を目的にRAGを導入しているが、従来のAI技術はテキストデータの学習・推論が中心だった。特に技術資料や分析レポートに多用される図表データの扱いが回答精度のボトルネックになっていた。
| 企業/組織名 | デンソー |
| 業種 | 製造 |
| 地域 | 愛知県刈谷市(本社) |
| 課題 | 社内外の文章を横断的に参照してナレッジを業務に生かしたいが、図表やグラフなどの非構造化データの解釈に課題があり、社内データ検索の精度と網羅性の向上を妨げていた |
| 解決の仕組み | OCR(光学的文字認識)とVLM(視覚言語モデル)の連携により図表やグラフをテキストベースへ構造化する。さらにプロンプトを最適化して大規模言語モデル(LLM)が解釈しやすい常態にすることで、RAG(検索拡張生成)における参照性を高める |
| 推進母体/体制 | デンソー、Wanderlust |
| 活用しているデータ | 図表・チャートなどの非構造化データ |
| 採用している製品/サービス/技術 | AIエージェント実行基盤「Copilot Studio」(米Microsoft製) |
| 稼働時期 | -- |
