• Talk
  • 製造

デンソー、人とロボットの協働に向け生成AIを使った自律型ロボット制御技術を開発

Microsoft Azureの「Azure OpenAI Service」と「Azure AI Speech」でロボットの実行基盤を整備

2024年2月14日

「100年に1度」と言われる大変革が進む自動車業界。その中で自動車部品サプライヤー国内最大手のデンソーがモビリティ(移動)を軸にした社会的価値の創造に向けた事業ドメインの拡大を図っている。その一環として、Microsoft Azureの「Azure OpenAI Service」が提供する生成AI技術を使い、自然言語で指示できる自律型ロボッ制御技術を開発した。中核メンバーに、生成AI技術を使ったロボット制御技術の開発の狙いや開発した仕組み、将来構想などを聞いた。(文中敬称略)

――デンソーは、自動車部品サプライヤーの国内最大手です。そのデンソーが、なぜロボット制御技術の開発に取り組むのでしょうか。

成迫 剛志(以下、成迫)  デンソー 執行幹部 研究開発センター クラウドサービス開発部長の成迫 剛志です。当社はクルマの技術をコアに、その価値の提供範囲を広げ、モビリティ社会の発展に貢献するため「自動車業界のTeir1」から「モビリティ社会のTier1」を目指しています。そのためにソフトウェア/サービス分野の開発にも力を注いでいます。

写真1:デンソー 執行幹部 研究開発センター クラウドサービス開発部長の成迫 剛志 氏

 私自身は2016年に当社に入社して以来、それまでのIT業界で得た知見を基に、モビリティ社会を見据えたソフトウェア/サービスの開発に、アジャイル開発チームを率いて取り組んできました。その過程で「移動したい人にとっての価値とは何か」を常に考えており、その一環として新しいロボット制御技術の開発にも取り組み始めました。

 モビリティのためのソフトウェアとして、まず頭に浮かぶのは自動運転の仕組みでしょう。社会実装のための法整備に伴って近い将来には、広義のロボットである自動運転車やAMR(Autonomous Mobile Robot:自立走行搬送ロボット)など、さまざまなロボットが自律的に動き回っている世界、すなわち人とロボットが協働できる社会が訪れるはずです。

 すでにデンソーグループでも、多品種少量生産の流れに沿い、1台で複数業務をこなせる多能工型の産業用ロボットを開発し活用しています。それに加えて今後は、人と協働できるロボットが、人との対話や会話によって、なすべきことを判断し、より多様な動作を実行できるようにしたいと考えています。

 そうした中、生成AI技術を使ったチャットサービス「ChatGPT」が2022年11月に発表されました。デンソーでも、その活用の可能性を文書作成やプログラム開発などから探り始めました。グループ内でロボットを開発しているデンソーとしては、「生成AI技術を使って実社会で動作するロボットを動かす」ことにも取り組みたいと考え、人が自然言語を使って口頭で指示できるロボット制御技術の開発プロジェクトを2023年4月に立ち上げたのです。

自然言語対応で人とロボットとのインタフェースの壁をなくす

――人の声で指示できるロボットは、これまでにもありました。それらとは、どう違うのでしょうか。

南 敬太郎(以下、南)  デンソー クラウドサービス開発部 ビジネスイノベーション室 自動化イノベーション課 担当係長の南 敬太郎です。ガソリンエンジンシステムの開発者でしたが、2019年からクラウドサービス開発部に移り、IoT(モノのインターネット)のデータ収集基盤の開発などに取り組んできました。

写真2:デンソー クラウドサービス開発部 ビジネスイノベーション室 自動化イノベーション課 担当係長の南 敬太郎 氏

 今回開発したロボット制御技術が従来と最も異なるのは、どう動作すべきかまでをロボットが自律的に決定する点です。生成AIを“頭脳”として使い、人間の自然言語による指示を理解し、その指示に対して適切な動作プログラムを自らが選定し動作します。

写真3:デンソーが開発した自然言語で指示を受け自律的に動作するロボット制御技術のデモシステム。写真は、男性の「ポインターがほしい」という指示に対し、飲み物やベルなどの中からポインターを選び出し手渡している様子

 ロボットの社会実装に向けては、現在のロボットには解決すべき点がいくつかあります。1つは、個々の動作に対し動作プログラムを事前に登録しなければならないことです。人が担っている作業は多彩で「ちょっと手伝ってほしい」動作であってもロボットは自律的には対応できません。

 その動作の登録も、極めて煩雑な制御コードを記述する必要があり、そのための十分な知識を持つ人材が不可欠です。残念ながら、そうした人材は少ないのが現状です。つまり、現状のロボットは身近に存在しても、多くの人には使いこなせないのです。

 このプロジェクトで目指すのは、従来型の決められた動作を確実に実行する、逆に言えば融通が利きにくいロボットとは正反対の“人間臭い”ロボットです。口頭での指示を受けて動作するだけでなく、生成AIが判断を間違えた場合でも、人が、その間違いを指摘すればロボットが容易に修正できる世界感です。さまざまな指示に対応できるよう、比喩表現や指示語などにも対応しています。具体的には、「眠気が覚める飲み物」の候補や、「あれ」「それ」といった指示でも、対象を見極めるなどです。

成迫  自然言語での指示にこだわっているのは、人とロボットの間にあるコミュニケーションの壁をなくすためです。デモシステムは人とロボットの対話になっていますが、ロボット同士が連携したり、ロボットの仕事を人が引き継ぎ、それをさらに別のロボットに引き継いだりといった場面も想定しています。人が対話によって仕事を進めているように、人とロボットが対話できることが両者の協働を可能にするのです。