- Column
- 大和敏彦のデジタル未来予測
生成AIが加速するGPU活用とデータセンターのGPU対応、そしてGPU as a Serviceへ【第88回】
GPUに特化したコロケーションを提供するデータセンターが増加
DXの推進のためのGPUを使用するためには、GPUを購入し、自社のセンターに設置する方法がある。だが大規模になれば、電力や冷却などの設備、災害対策や物理的なセキュリティ対処なども必要になり、その構築・保守の負担は大きくなる。そこにデータセンターを使うメリットが生まれる。データセンターは、サーバーの安定稼働のための電力・空調設備、サービス提供のための大規模なネットワーク設備を備え、災害にも強い建物に機器を設置し稼働させているからだ。
データセンターにおけるコロケーションは、データセンターのスペースを借りて、そこにサーバーやネットワーク機器を設置するモデルである。自社のサーバーをデータセンターに設置し自社専用のプライベートクラウドという形で専用に使え、GPUの自社使用やAIサービスの提供が可能になる。
コロケーションサービスを提供する企業の1社が米エクイニクスである。1998年に事業を開始した同社は多国籍企業に成長し、世界24カ国に約200カ所のデータセンターを保有する。ネットワークや電源、空調を完備した大規模施設をコロケーション用途に提供している。
AIやGPUにも対応し、AIモデルの学習用のAIインフラと、推論用のAIエッジインフラを提供するサービスを始めている。GPUやCPUが出す熱を効率的に冷却しエネルギー効率を高めるための液体冷却サービスも実現済みだ。
最近は、GPUに焦点を当てたコロケーションデータセンターの提供が増えている。例えば英Digital Reality Trustは、データセンターを保有しリース等で提供する不動産投、大電源容量と冷却技術を完備した資・管理会社として、世界に210カ所以上のデータセンターを保有する。GPUの高性能サーバーを設置できるように、大容量電源と冷却技術を完備したデータセンターを構築している。
日本では、三菱商事と組んでMCデジタル・リアルティを設立した。千葉県印西市にあるキャンパスでは、2つのデータセンターで合計73メガワットの電源容量を持ち、ラック当たり最高70キロワットの電源容量と冷却技術を用意する。
自社センターまたはコロケーションにより自社専用のGPUサーバーを持つことには、機密性の高いデータを自ら監視でき、データのプライバシーやセキュリティを確保できるというメリットがある。しかし、GPUを自社所有すると、さまざまな課題も生まれる。
具体的には、GPU購入資金に加え、電源や空調の完備や運用が必要になる。GPUの必要度合いに合わせてGPUの数を増減させることが難しく、GPU活用の急増に対処できない。
GPUサーバーの陳腐化も問題になる。例えばNVIDIAの最新チップ「Blackwell」は、1世代前の「GB200」や「H100」と比較すると、AI学習時の性能は4倍、推論時の性能は30倍にアップした一方、電力効率は25倍改善すると言われている。性能や電力効率の改善速度は速く、最新のGPUを使う場合には考慮が必要だ。
GPUをサービス化する「GPU as a Service」も登場
設備投資やGPUの陳腐化といった課題を避け、必要な時に必要なだけのGPUを利用可能にするのが「GPU as a Service」というクラウドベースのGPU提供サービスだ。利用者は、データセンターが準備するGPUの機能を必要なだけ時間単位での課金やサブスクリプションモデルで利用できる。
GPU as a Serviceを提供するデータセンター事業者に米CoreWeaveや米Lambda Labがある。AIモデルの構築や学習などに取り組む小規模利用者をターゲットに、必要なだけのGPU資源を短期間提供する。
このうちCoreWeaveは、AI開発者のインフラニーズに応えることを目指すクラウド企業グループだ。NVIDIA初の「エリートクラウドサービスプロバイダー」に認定され、その企業価値は190億ドル(約2兆9000億円、1ドル152円換算)とされる。2024年末までにスペインやスウェーデンなど世界28カ所に拠点を拡大し、23億ドル(約3500億円、同)の売り上げを見込む。
CoreWeaveはもともと、Atlantic Cryptoという社名で、暗号資産「Ethereum(イーサリアム)」をマイニングする会社として知られていた。だが暗号資産の暴落により、所有していた大量のGPUを活用し、GPUに特化したクラウドリソースの提供会社に変わった。
同社のGPU as a Serviceでは、高度な設定ができ可用性が高いサービスを、大規模なGPUを必要とする企業に向けて、GPUをレガシーなクラウドプロバイダーと比べて高速・安価にオンデマンドで提供する。対象は、計算資源を使う機械学習・ディープラーニング、VFXレンダリング、画像をピクセルにしたストリーミング、バッチ処理など、集約型のユースケースである。
米MicrosoftはCoreWeaveと複数年に渡る数十億ドルの契約を結んでいる。OpenAIが必要とするコンピューティング能力を提供するためだ。米AWS(Amazon Web Service)もGPU as a Serviceとして数千のコンピューティングコアを持つ「P6 instance」を発表した。NVIDIAのGPU「Blackwell」を搭載している。
GPUの利用環境の運用・維持にはDX推進が必要に
このようにAIデータセンターやGPU as a ServiceによってGPU環境が整備され使い易くなってきた。それを背景に、AIのように幅広い分野のソリューションや業界特化のソリューションなど、さまざまな分野でGPUによる変革が広がっている。GPUを単に計算や処理の高速化に使うだけでなく、変革のために使っていくことがイノベーションのためには重要だ。
日本でもAIデータセンターが多数登場しており、GPUが使い易くなっている。これらGPUを有効に活用するには、ソフトウェアや、それを使ったDXが必要である。ソフトウェアを準備しなければGPUを使いこなすことは難しく、また。それらを活用したDXが進まなければGPUサーバーの運用・維持も難しくなる。
大和敏彦(やまと・としひこ)
ITi(アイティアイ)代表取締役。慶應義塾大学工学部管理工学科卒後、日本NCRではメインフレームのオペレーティングシステム開発を、日本IBMではPCとノートPC「Thinkpad」の開発および戦略コンサルタントをそれぞれ担当。シスコシステムズ入社後は、CTOとしてエンジニアリング組織を立ち上げ、日本でのインターネットビデオやIP電話、新幹線等の列車内インターネットの立ち上げを牽引し、日本の代表的な企業とのアライアンスおよび共同開発を推進した。
その後、ブロードバンドタワー社長として、データセンタービジネスを、ZTEジャパン副社長としてモバイルビジネスを経験。2013年4月から現職。大手製造業に対し事業戦略や新規事業戦略策定に関するコンサルティングを、ベンチャー企業や外国企業に対してはビジネス展開支援を提供している。日本ネットワークセキュリティ協会副会長、VoIP推進協議会会長代理、総務省や経済産業省の各種委員会委員、ASPIC常務理事を歴任。現在、日本クラウドセキュリティアライアンス副会長。