AI用語集
人工知能の完全辞典
GPUパススルー
仮想マシンが中間の仮想化レイヤーを介さず、物理GPUハードウェアに直接かつ排他的にアクセスできるようにする技術。このアプローチはネイティブパフォーマンスを提供しますが、複数のVM間でのGPU共有を制限します。
仮想GPU(vGPU)
物理GPUを複数の仮想インスタンスに分割し、異なる仮想マシンやコンテナ間で共有する仮想化技術。各vGPUは独自のリソースが割り当てられた独立したGPUとして機能します。
マルチインスタンスGPU(MIG)
NVIDIAのアーキテクチャで、Ampere GPUを専用リソース(コンピューティング、メモリ、キャッシュ)を持つ複数の分離されたインスタンスに分割可能。MIGはサービス品質を保証するためにインスタンス間で厳格な分離を確保します。
タイムスライス共有
複数のユーザーが時間スライス(タイムスライス)でGPUアクセスを交互に行うGPU共有方法。このアプローチは利用率を最大化しますが、負荷によって変動する遅延を引き起こす可能性があります。
CUDA仮想化
最適化されたパフォーマンスで仮想化環境でGPUアプリケーションを実行できるようにする、API CUDAの特化された仮想化。CUDA呼び出しを適切なGPUリソースへインターセプトおよびルーティングを含む。
API転送
VMからのグラフィックスまたはコンピューティングAPI呼び出しをインターセプトし、ホスト物理GPUへリダイレクトするメカニズム。コード変更なしで既存アプリケーションとの互換性を実現します。
プロファイルベース割り当て
事前定義されたリソースプロファイル(メモリ、コンピューティング、帯域幅)に基づくGPU割り当て戦略。異なるワークロードの特定のニーズに合わせてGPUリソースを正確に調整できます。
GPUパーティショニング
GPUリソースを論理的または物理的に小さなセグメントに分割し、異なるアプリケーションやVMに割り当て可能にするプロセス。メモリ、コンピューティングユニット、メモリコントローラのパーティショニングを含む。
メディエーテッド・パススルー
ダイレクトパススルーと完全仮想化のハイブリッドで、最小限の仲介層を通じてGPUに準ネイティブなアクセスを提供します。最適なパフォーマンスと、より良いリソース管理と分離を組み合わせます。
GPUスケジューラー
複数の同時リクエスト間でGPUリソースのスケジューリングと割り当てを管理するコンポーネント。優先度とサービス品質の制約を尊重しながら、GPUの使用を最適化します。
直接GPUアクセス
仮想化されたアプリケーションがソフトウェアエミュレーション層を介さずにGPUリソースに直接アクセスできるアーキテクチャ。レイテンシーを削減し、計算パフォーマンスを最大化します。
仮想GPUマネージャー
vGPUインスタンスのライフサイクル、割り当て、監視を管理する中央管理ソフトウェア。管理者が定義したポリシーに従って、利用可能なGPUリソースを調整します。
GPUメモリ仮想化
複数のVMがVRAMを共有しながら専用メモリの錯覚を維持できるようにする物理GPUメモリの抽象化技術。ページング、動的割り当て、メモリ分離を含みます。
GPU用SR-IOV
GPU向けのSingle Root I/O Virtualization標準の適用で、ハードウェアへの直接アクセスパスを持つ仮想機能(VF)の作成を可能にします。ベアメタルに近い分離とパフォーマンスを提供します。
GPUコンテナ化
ドライバーとCUDAライブラリの分離を伴う軽量コンテナへのGPUリソースの統合。VMと比較してオーバーヘッドが最小限で、GPUアプリケーションの迅速なデプロイを可能にします。
リモートGPU仮想化
リモートGPUリソースにネットワーク経由でローカルであるかのようにアクセスできるアーキテクチャ。レイテンシーを最小化し計算パフォーマンスを維持するために最適化されたプロトコルを使用します。
動的GPU割り当て
アプリケーションの即時的なニーズに応じてGPUリソースを動的に割り当て・解放する能力。リソースクォータをリアルタイムで調整することにより、GPUの使用率を最適化します。
GPUプーリング
複数の物理GPUを統一されたリソースプールに集約し、要求に応じて分配すること。データセンター規模でのGPU計算リソースの負荷分散と弾力性を実現します。