ニュース

ソフトバンク、「AIデータセンター GPUクラウド」を10月に提供開始～運用負荷の軽減と柔軟性を実現するクラウドサービス

渡邊悠太

2026年5月26日 12:24

　ソフトバンク株式会社は、同社が開発したAIデータセンター向けのソフトウェアスタック「Infrinia AI Cloud OS」を搭載したクラウドサービス「AIデータセンター GPUクラウド」の提供を10月に開始する。提供に先立ち、ソフトバンクおよびグループ会社においてベータ版の利用が開始されている。

　同サービスは、同社が掲げる新たな成長戦略「Activate AI for Society」の下、ネオクラウド事業として展開するもので、ソフトバンクのAI計算基盤と、独自のソフトウェアスタック「Infrinia AI Cloud OS」を組み合わせたクラウドサービス。同ソフトウェアスタックの搭載により、マルチテナント環境に対応した「Kubernetes as a Service」（KaaS）や、大規模言語モデル（LLM）の推論機能をAPIとして提供する「Inference as a Service」（Inf-aaS）が利用可能になる。

　同社が国内のデータセンターに構築したAI計算基盤を活用することで、日本国内で完結する安全なデータ管理・運用の下、AIモデルの学習から推論、データ処理といった幅広いタスクを効率的かつ柔軟に実行できるとしている。また、GPUの管理やKubernetesによる運用、AIワークロードの実行などを一元管理および自動化することで、最適な環境で各ワークロードの処理ができ、運用負荷とコストの低減とともに、変化する要件にも柔軟に対応できる安定した環境を実現できるという。

　同サービスの特徴として、次の3点が挙げられている。

学習から推論まで幅広いワークロードに対応可能

　LLMの開発など大量の計算資源を必要とするAIの学習用途から、迅速なレスポンスが求められる推論用途まで、幅広いワークロードに対応したGPU環境が提供される。

　基盤には「NVIDIA GB200 NVL72」をはじめとする最先端のアクセラレーテッドコンピューティングを採用。NVIDIA NVLinkを介して相互接続された高性能なNVIDIA Blackwell GPU間通信と高性能なストレージを組み合わせることで、マルチテナント環境においても、LLMの学習や複雑な推論処理に適した環境を実現しているという。

Kubernetes as a Service（KaaS）による柔軟な運用

　アプリケーションのデプロイやスケーリングの自動化、コンテナ化されたアプリケーションの管理などを行うシステムのKubernetesを活用することで、多数のコンテナを一元的かつ自動的に管理することが可能で、開発環境の構成変更やスケーリングといった運用負荷を軽減できる。

　また、コンテナ技術により、アプリケーションの起動を高速化するとともに、デプロイやスケーリングを効率化して、AIモデルの開発から実装、運用までの一連のプロセスを迅速化する。さらに、Kubernetesによる負荷分散により、安定したサービス提供を可能にするとともに、障害発生時に自動復旧する仕組みにより、高い事業継続性を実現しているという。

Inference as a Service（Inf-aaS）によるモデル推論環境の提供

　Kubernetes上でのモデル推論基盤の構築・運用を自動化することで、推論APIの構築を支援する。これにより、インフラ管理にかかる負荷を軽減して、独自開発のAIモデルや任意のAIモデルを選択するだけで、迅速で、かつ安定した推論環境を利用できるという。

　同社は今後、通信基盤を生かしてAI時代の社会インフラを構築する「Telco AI Cloud構想」に基づき、「AIデータセンター GPUクラウド」と「AI-RAN」を統合することで、学習から推論までのAIの計算処理の最適化を図るとともに、低遅延・高信頼を実現するソブリン性を備えた分散型のAIインフラの構築を目指していくとしている。