AI用語集
人工知能の完全辞典
意識的なアーティファクト量子化(AQ)
精度低下に最も敏感な層やニューロンを特定し保存する高度な量子化手法。モデルの性能劣化を最小限に抑えながら、サイズと速度を最適化する。
ニューラルネットワーク剪定(Pruning)
ニューラルネットワークにおいて非必須と判断される重み、ニューロン、または層全体を体系的に除去するプロセス。エッジデバイスでの効率的な展開に向け、計算複雑性とメモリフットプリントを削減する。
MobileNetV3アーキテクチャ
モバイルおよび組み込みアプリケーション向けに最適化された畳み込みニューラルネットワークアーキテクチャファミリー。ニューラルアーキテクチャサーチ(NAS)と逆転ブロックを活用し、リソース制約のあるハードウェア上で精度とレイテンシのバランスを取る。
TensorRTによる展開
NVIDIAのオプティマイザ兼ランタイム。学習済みAIモデルをNVIDIA GPU向けに高度に最適化された推論エンジンに変換し、層の融合、混合精度推論のためのキャリブレーション、カーネル選択などの技術を適用してスループットを最大化する。
OpenVINOツールキット
Intelが開発したツールキット。コンピュータビジョンおよびAIモデルのIntelハードウェア広範な範囲への展開を加速する。中間形式(IR)によるモデル最適化と、特定のベクトル命令(AVX、VNNI)の活用を特徴とする。
混合精度推論
AIモデル実行技術。FP16を活性化、FP32を累積に使用するなど、浮動小数点データ型の組み合わせで計算を実行。互換GPU上での計算加速とメモリフットプリント削減を実現する。
ONNXランタイム
クロスプラットフォーム推論エンジン。Open Neural Network Exchange(ONNX)形式モデルの実行を可能にし、ターゲットハードウェア(CPU、GPU、NPU)向けに操作を最適化。様々なエッジデバイスへのAIアプリケーション展開のための統一APIを提供する。
AI向けマイクロコントローラ(TinyML)
機械学習の分野。キロバイト単位のRAMとメガヘルツ単位のCPUを有する超低消費電力マイクロコントローラ上で超軽量AIモデルを動作させることを目的とする。バイナリ量子化や積極的剪定などの極端な最適化技術を必要とする。
ニューラルプロセッシングユニット(NPU)
行列乗算や活性化関数などのニューラルネットワーク演算を加速するために設計された特殊化処理ユニット(ASICまたはアクセラレータ)。AIワークロードにおいて、汎用CPUやGPUよりもはるかに優れたエネルギー効率を発揮する。
レイヤーフュージョン
コンパイル最適化技術の一つで、ニューラルネットワークの連続する複数の層(例:畳み込み層、バッチ正規化、活性化関数)を単一の演算に結合する。これにより、メモリオーバーヘッドとデータパスの回数を削減する。
アクセラレータ向けコンパイル
AIモデルの計算グラフを、特定のハードウェアアクセラレータ(NPU、TPU、FPGA)で実行可能な命令セットに変換するプロセス。モデルの演算をターゲットハードウェアの最適化されたプリミティブにマッピングする。
レイテンシ最適化
組み込みビジョンシステムの応答時間を最小化するための技術群。モデル複雑性の低減、処理パイプラインの最適化、専用ハードウェアの活用を含み、リアルタイム処理を保証する。
オンチップメモリ管理
プロセッサまたはアクセラレータ上で利用可能な高速だが限られたSRAMメモリの割り当てと使用に関する戦略。より遅く電力消費の大きいDRAMメモリへのアクセスを最小化するために重要であり、エッジコンピューティングの性能における鍵となる要素である。
エッジ向けニューラルアーキテクチャサーチ(NAS)
エッジデバイスに典型的なレイテンシ、電力消費、モデルサイズの制約に対して最適化されたニューラルネットワークアーキテクチャを自動的に設計するプロセス。性能と効率性の最適なバランスを見つけることを目的とする。
エッジでのリアルタイム物体検出
YOLOやSSDなどの高度に最適化されたモデルをエッジデバイスに展開し、ビデオストリーム内の物体を識別・位置特定するコンピュータビジョン応用。数十ミリ秒オーダーのレイテンシで即時の反応を可能にする。
軽量セマンティックセグメンテーション
BiSeNetやFast-SCNNなどの簡素化されたアーキテクチャモデルによって実行される、ピクセル単位の分類タスク。リソースが限られたデバイス上で動作するように設計され、セグメンテーション精度とリアルタイム要件のバランスを取る。
エッジでのパフォーマンスプロファイリング
ターゲットデバイス上でのAIモデルの実行を詳細に分析し、計算上のボトルネック、エネルギー消費、リソース使用状況を特定し、パフォーマンス目標を達成するための最適化作業を導く。