NVIDIA AI Enterprise & Base Command
NVIDIA AI Enterprise
NVIDIA AI Enterpriseは、業界最高水準の開発ツール、 AIソリューションワークフロー、フレームワーク、事前学習済みモデル、信頼できる管理とオーケストレーションによるインフラストラクチャ最適化など、フルスタックソフトウェアの豊富なライブラリにより、パフォーマンス、高可用性、セキュリティが確保できます。
最新のハイブリッドクラウドにおけるAIワークロードの迅速な展開、管理、スケーリングを可能にするNVIDIA の主要な実現技術とソフトウェア、およびエンタープライズサポートが含まれています。
2024年3月に発表された「NVIDIA AI Enterprise 5.0」にて、生成AI推論用のマイクロサービス「NVIDIA NIM」(NVIDIA Inference Microservices)が実装されました。
NIMを利用することで、APIカタログからオープンソースの最新モデルを選択し、素早く自己ホスト型でテストするための環境を構築できます。
また、オンプレミス・パブリッククラウド・仮想環境などさまざまなインフラへ迅速にデプロイ可能です。
POINT
01
NVIDIA AIフレームワーク、事前学習済みモデル、リソース (Helm グラフ、Jupyter Notebooks、ドキュメントなど) をまとめてパッケージ化
POINT
02
「Triton Inference Server」や「TensorRT-LLM」など生成AIの推論に必要なソフトウェアがAPIカタログからインストール可能な「NVIDIA NIM」により開発をスピードアップ
POINT
03
NVIDIA-Certified Systems™に認定されたオンプレミスサーバー、VMware/Kubernetesなどのオーケストレーション環境、パブリッククラウドで利用可能
POINT
04
NVIDIAエンジニアによるエンタープライズサポートとアップデート
NVIDIA Base Command™
サーバーやストレージ、ネットワークなど複数の要素で構成されるGPUクラスタを運用する際は、各ノードの状態を管理・可視化し、全てを連携して動作させる必要があります。
NVIDIA Base Command™ は、生成AI/LLMなどの大規模なAIトレーニングの運用を効率化するソフトウェアパッケージです。チームでの共同開発ワークフローを制御するジョブスケジューラ・オーケストレーターや、ネットワーク設定機能、コンテナの管理・可視化ツールが包含されています。
NVIDIA Base Command™ を利用することで、AIトレーニングプロジェクトを一元的に管理することができ、GPUインフラストラクチャから最大限の可能性を引き出すことができます。
POINT
01
マルチGPU/マルチノードを一括管理し、リソース使用率や実行状況を遠隔監視・レポーティング。運用経験が少ない担当者でも管理できるよう設計されたGUIにより、感覚的な操作が可能。
POINT
02
NVIDIAドライバ、CUDA、事前学習済みデータセット、ジョブスケジューラ等を提供し、ディープラーニングモデルの実行環境を即座に立ち上げ。
POINT
03
RDMA設定・管理機能を提供し、高帯域・低遅延なインターコネクト性能を発揮