• News
  • 共通

接客やロールプレイングなどのための対人用AIアバター、LLMと音声・画像生成AIの同期で人間らしさを演出

上田 羽純(DIGITAL X 編集部)
2026年5月1日

接客や面接、ロールプレイングなどに使う対人用AI(人工知能)アバターが進化している。LLM(Large Language Model:大規模言語モデル)と、音声・画像生成AIを同期させることで、文脈に合った声や動きをリアルタイムに生成し、より人間らしい応答や感情表現を演出する。「Japan IT Week 【春】」(主催:RX Japan、2026年4月8日~4月10日)と併催イベントに出展されたAIアバターから、その動向を紹介する。

 接客や面接、ロールプレイングといった対人用途に向けて、仮想的な人物やキャラクターを動かすAI(人工知能)アバターが増えている。アバターの生成にも生成AI技術を利用することで、より人間らしい表現をリアルタイムに生成しようとする製品が増えつつある。そうした対人用AIアバターが「Japan IT Week 【春】」(主催:RX Japan、2026年4月8日~4月10日)と各併催イベントでは複数出展された(表1)。

表1:Japan IT Week 【春】に出展されていたAIアバターの例
製品名AVACOMLinKaLivex AIAI面接アバトレ
販売元AVITAナノコネクトネオジャパンPeopleXAVITA
用途接客(イベント、常設総合案内、店頭、Webサイト)接客(常設総合案内、店頭、Webサイト)接客(イベント、常設総合案内、店頭)面接ロールプレイング
アバターの見た目写実的な人間、デフォルメされたキャラクターデフォルメされたキャラクター写実的な人間デフォルメされたキャラクター写実的な人間、デフォルメされたキャラクター
導入費用1施設10万円程度~サイネージ版15万円程度~、Webサイト版25万円程度~策定中要相談初期費用+1IDあたり月額9800円~

 AIアバターは対人用のチャットボットに2D(2次元)や3D(3次元)の人物像を組み合わせたもの。LLM(Large Language Model:大規模言語モデル)による応答精度を高めるために、RAG(Retrieval-Augmented Generation:検索拡張生成)やAPI(Application Programming Interface)連携などの採用が進む。それが、LLMによる応答内容の生成に合わせて、声や身振り・手振りなどにも生成AI技術を取り入れ、口の動きを声に合わせるリップシンクや、文脈に沿った声色や表情、動作などをリアルタイムに生成し、存在感を演出したり場面に応じた表現を実現しようとしている。

目的や相手に合わせて「人格」を使い分ける

 対人用AIアバターの用途は大きく(1)店頭での接客や観光地のでの案内、(2)面接、(3)教育用ロールプレイングに分けられる。接客用のAIアバターは、主に大型サイネージやホログラムにCG(Computer Graphics)による人物像を表示し、売り場案内や製品紹介、観光地の紹介、問い合わせ対応などに当たる。

 例えば、グループウェアなどを販売するネオジャパンが取り扱う「LiveX AI」(米LiveX AI製)は、写実的な人間のCGモデルを使い、リップシンクや発声に合わせた手の振り、肩をすくめる動作や体重移動といった全身の仕草を生成し続ける(写真1)。顧客からの問い掛けへの待機状態や、回答の生成中、結果の出力などの各段階間での不連続な動きを防ぎ、常に顧客と対峙しているような体験を演出する。

写真1:ネオジャパンのLivex AIのAIアバターの例

 LiveX AIではキャラクターに合わせた調整もできる。欧米人のアバターなら身振り・手振りの大きな動きを、日本人のアバターでは直立に近い姿勢を維持するなどだ。現在は試験運用段階で、国内市場により適した挙動などを検証中という。

 アバター・ロボット研究の第一人者である石黒 浩 氏が率いるAVITAの「AVACOM」は、写実的な人のCGモデルに加え、頭が大きくて手足が短いなどデフォルメしたキャラクターなども用意する(写真2)。「子どもの参加が多いイベントや、特定のキャラクターが登場するイベントなど、対応する顧客層が親しみやすい環境を用意するため」(AVITAの担当者)だ。

写真2: AVITAの「AVACOM」が用意するAIアバターの例