AI用語集
人工知能の完全辞典
フォワード拡散プロセス
複数の時間ステップで入力データに段階的にガウスノイズを追加し、複雑な分布を正規分布に変換するマルコフ過程。
リバース拡散プロセス
各時間ステップでデータ分布の対数確率の勾配を推定することで、データを段階的にノイズ除去する逆プロセス。
スコアマッチング
分布の正規化定数を計算することなく、対数尤度の勾配(スコア)を推定できる最適化技術。
ノイズパラメータ
フォワードプロセスの各ステップで追加されるガウスノイズの分散を決定する関数で、線形またはコサインで変化してノイズ添加の進行を制御する。
タイムステップ
拡散プロセスにおける時間ステップを表す離散変数で、フォワードプロセスの場合は0(元データ)からT(純粋ノイズ)までの範囲をとる。
ノイズエンコーダ
特定のタイムステップでデータに追加されたノイズを予測するように学習したニューラルネットワークで、予測されたノイズを差し引くことで元のデータを再構築できる。
条件付きノイズ除去
テキスト、画像、特定のクラスなどの追加情報に条件付けられたデータを生成する拡散プロセスの拡張。
拡散潜在空間
オートエンコーダで圧縮された潜在空間で動作する拡散モデルの変種で、生成品質を維持しながら計算コストを大幅に削減する。
クロスアテンション機構
条件付き拡散モデルがモーダル間の相互作用を通じて外部情報(テキストプロンプト)を生成プロセスに統合することを可能にするアテンションモジュール。
スコア推定器
データ分布の対数尤度の勾配を近似するよう訓練されたニューラルモデルで、拡散モデルにおける生成プロセスを導くために不可欠。
DDPMサンプリング
拡散モデルの元の確率的サンプリング手法で、各ノイズ除去ステップでガウスノイズを使用するマルコフ過程を利用。
DDIMサンプリング
DDPMサンプリングのより高速な決定論的変種で、はるかに少ないノイズ除去ステップで高品質なサンプルを生成可能。
分類器ガイダンス
事前学習済み分類器を使用し、クラス確率に応じてノイズ除去勾配を修正することで、生成プロセスを特定のクラスに導く技術。
分類器なしガイダンス
分類器の別個の学習を回避する分類器ガイダンスの代替手法で、条件付きモデルと非条件付きモデルを同時に使用してガイダンスを実行。
ノイズ除去ステップ
モデルがノイズ除去変換を適用してノイズのある状態からノイズの少ない状態へ移行する逆プロセスの個別の反復。
推論時間
完全なサンプルを生成するために必要な時間で、主に逆拡散プロセスで使用されるノイズ除去ステップの数に依存する。
拡散におけるナイキスト周波数
拡散モデルにおいて高周波数を維持する理論的な概念で、画像生成プロセス中に細かいディテールを保持するために重要です。