AI用語集
人工知能の完全辞典
メモリレジスタ
各SM (Streaming Multiprocessor) スレッドのプライベートで最速のメモリ。1クロックサイクルのアクセスレイテンシでローカル変数を格納するために使用されます。
メモリスラッシング
最適化されていないメモリアクセスによるパフォーマンス低下現象。高いキャッシュミス率とメモリバンクの競合を引き起こします。
メモリバンクコンフリクト
同じ共有メモリバンクの異なる場所への同時アクセス競合。アクセスの直列化とパフォーマンス低下を引き起こします。
非同期メモリ転送
CUDAストリームを介してカーネル計算と並行して実行されるCPU-GPU間のデータ転送。メモリレイテンシを隠蔽し、GPUの使用率を最適化します。
メモリアライメント
データ構造を特定のバイト境界(128、256、512ビット)に整列させ、最大のコアレスセントメモリトランザクションを確保すること。
ゼロコピーメモリ
コピーなしでGPUがホストメモリに直接アクセスする技術。メモリマッピングを使用してメモリ消費と転送時間を削減します。
CUDAストリーム
GPU上で順序どおりに実行される操作シーケンス。タスクの並列処理と計算-転送のオーバーラップを可能にし、リソース使用率を最適化します。
メモリプール
高速な割り当て/解放のためのGPUメモリブロックの事前割り当て。実行時のフラグメンテーションと動的割り当てコストを削減します。
メモリプリフェッチ
GPUキャッシュメモリに実際の使用前にデータを事前にロードし、メモリレイテンシを隠蔽し、命令とデータの並列性を向上させる。
メモリページング
CPUとGPU間のメモリページの管理で、オンデマンドでの移行と使用量に基づく排除を含み、限られたGPUメモリの使用を最適化する。
CUDA統合仮想アドレス指定
ホストメモリとデバイスメモリを組み合わせた単一の仮想アドレス空間で、CPUとGPU間での透過的な転送と有効なポインタを可能にする。
メモリ占有率
メモリ使用量によって影響されるSMあたりのアクティブワープの比率で、実現可能な並列性のレベルとGPUリソースの使用効率を決定する。