• Column
  • 大和敏彦のデジタル未来予測

AIエージェントの自律化で加速する学習中心から推論中心の流れ【第105回】

大和 敏彦(ITi代表取締役)
2026年6月22日

 AI技術の進化に伴い推論機能も高度化する。例えば多段階推論という手法では、問題を複数のステップに分解して段階的に解決を考えることで複雑なタスクの解決を実現する。

 そうした進化は、東京大学理科3類や京都大学医学部の入学試験で合格者最高点を上回ったり、米Anthropicの「Claude Mythos Preview」がセキュリティの脆弱性を発見する優れた能力を示したりと成果を見せている。Claude Mythosは、多段階推論や攻撃を模倣したシミュレーションを実行することで精度を高めており、脆弱性の発見と悪用の可能性は使用制限や政府対応の対象になっている。

推論需要の高まりに合わせGPUデータセンターも変わる

 AI推論の世界市場規模は、2025年の約1062億ドルが2030年には約2550億ドルと年平均15%成長が予測されている(米MarketsandMarkets調べ)。GPUの活用分野も学習から推論へと広がっていくことになる。

 GPUが推論目的で使われるようになれば、データセンターも対応が必要になる。学習用途のデータセンターは、超低遅延で相互接続された巨大なGPU群を完備した巨大施設になる。その稼働には電力や冷却水などが不可欠で巨額な投資が必要である。

 一方、推論用途のデータセンターは、それほどの計算能力を必要としない。処理形態としても、学習がバッチ形式で大量のGPUを占有しまとめて実行するモデルであるのに対し、推論は学習に比べまとまったGPU は必要とせず、代わりに高いリアルタイム処理能力を必要とする。レイテンシの保証や常時稼働の必要性も出てくる。処理の遅延時間の最小化や処理のスループットの増大も検討しなければならない。ただ推論サービスの数の増加に比例して必要なGPUの数も増えていく。

 課金モデルを変わってくる。学習中心のGPUサービスでは、バッチ処理で長時間占有する使い方に対し、GPUインスタンスを時間単位で売るモデルが採用された。推論中心の使い方では、リアルタイムのトランザクション処理が必要なため、課金は1秒当たりのトークン生成量を売る「TaaS:Token as a Service」モデルになり、API(Application Programming Interface)課金が行われる。

 例えばOpenAIは、トークンのほか、入力、キャッシュ入力、出力にも課金する。GPUサービス提供者としては、1秒当たりのトークン生成量やレイテンシ、同時リクエスト数を競う形になるため、サービスを提供する上では、モデルの品ぞろえ最適化、セキュリティなどが差別化ポイントになる。

 推論精度や処理速度を高めるためには、AIモデルが重要になってきている。AIモデルは、学習によって大量のデータからパターンやルールを獲得したモデルである。LLMに追加学習させたり、人によるフィードバックによって強化学習をさせたりして構築し、予測・分類・文章生成などに活用する。

 既に、文章に特化したモデルや画像・音声を扱うマルチモーダルモデルなど、さまざまなAIモデルが実用化されている。前回、AIサービスを加速するプラットフォームとして紹介した「NVIDIA-NIM(NVIDIA Inference Microservice)」は、LLMのほか、言語・マルチモーダル推論や物理推論・世界モデルなどのAIモデルを提供し、それらを利用した推論サービスの構築を容易にしている。

社会変革と同時に非効率化や不具合も起こる

 このように、AIモデルや多段階推論などの推論モデルによって推論能力は向上している。推論プラットフォームによって推論機能の活用が迅速に正確にできるようになってきている。

 AI推論が広がっていけば、人や会社の意思決定や、組織・仕事が大きく変わっていく。AI技術を使った自動化・自律化だけでなく、個人に特化したサービスなど新しいサービスも開発可能になる。組織や雇用形態も大きな影響を受け、少人数の組織でも成果を出せるようになる。

 一方で、AIシステムに相談することが常態化すれば、依存度が高まり自分で考える能力が衰退したりする危険もある。AI技術による個別最適化が進み全体として効率が下がったり不具合が生じたりする可能性もある。これらの変化やリスクは既に現実のものになりつつある。

大和敏彦(やまと・としひこ)

 ITi(アイティアイ)代表取締役。慶應義塾大学工学部管理工学科卒後、日本NCRではメインフレームのオペレーティングシステム開発を、日本IBMではPCとノートPC「Thinkpad」の開発および戦略コンサルタントをそれぞれ担当。シスコシステムズ入社後は、CTOとしてエンジニアリング組織を立ち上げ、日本でのインターネットビデオやIP電話、新幹線等の列車内インターネットの立ち上げを牽引し、日本の代表的な企業とのアライアンスおよび共同開発を推進した。

 その後、ブロードバンドタワー社長として、データセンタービジネスを、ZTEジャパン副社長としてモバイルビジネスを経験。2013年4月から現職。大手製造業に対し事業戦略や新規事業戦略策定に関するコンサルティングを、ベンチャー企業や外国企業に対してはビジネス展開支援を提供している。日本ネットワークセキュリティ協会副会長、VoIP推進協議会会長代理、総務省や経済産業省の各種委員会委員、ASPIC常務理事を歴任。現在、日本クラウドセキュリティアライアンス副会長。