AI用語集
人工知能の完全辞典
拡散モデル
ノイズを追加・除去する漸進的プロセスを使用してデータを純粋なノイズに変換し、リアルなサンプルを再構築する生成アーキテクチャ。これらのモデルはGANより高いトレーニング安定性で高品質な画像生成に優れています。
順拡散プロセス
トレーニング段階で、ガウシアンノイズを元のデータに複数のタイムステップで段階的に追加し、純粋なノイズ分布に到達するプロセス。このマルコフプロセスは数学的に可逆で予測可能になるように設計されています。
逆拡散プロセス
純粋なノイズ分布から段階的にノイズを除去して一貫性のあるデータを再構築するよう学習する生成段階。このプロセスはデータ分布のスコア勾配推定によってガイドされます。
DDPM (Denoising Diffusion Probabilistic Models)
2020年にHoらによって導入された基本的な拡散モデルのクラスで、線形分散スケジュールとノイズ予測目的を使用します。DDPMは現代の拡散アーキテクチャの数学的基礎を確立しました。
ノイズスケジュール
順拡散プロセスの各ステップで追加されるノイズの量を制御する時間的パラメータ設定。適切に設計されたスケジュールは情報の保持とデノイジングの効率のバランスを最適化します。
分類器フリーガイダンス
外部分類器を必要とせずにテキストへの忠実性を向上させるため、条件付きと非条件付きの予測を組み合わせる生成制御技術。この方法により、多様性を維持しながら生成のきめ細かい制御が可能になります。
潜在拡散モデル
ピクセル空間ではなく、圧縮された潜在空間で動作することで拡散モデルを最適化するアーキテクチャ。このアプローチは計算コストを大幅に削減しながら、高い生成品質を維持します。
祖先サンプリング
生成サンプルの多様性を向上させるため、決定的デノイジングと制御されたノイズ追加を組み合わせる確率的サンプリング手法。この技術は生成における品質と創造性のバランスを取ります。
拡散タイムステップ
拡散プロセスで使用される離散的なステップ数。通常、品質と性能の最適なバランスを取るために100〜1000ステップの間で設定されます。タイムステップの選択は、生成される詳細の細かさに直接影響します。
デノイジングU-Net
残差接続とアテンション機構を持つニューラルネットワークアーキテクチャで、拡散の各ステップでノイズを予測・除去するように特別に設計されています。U-Net構造は、空間情報を効率的に保持しながらグローバルな依存関係を捕捉します。
確率微分方程式
前方および逆拡散プロセスを厳密な理論的枠組みで統一する連続的な数学的定式化。このアプローチにより、理論的分析と新しいサンプリングアルゴリズムの開発が可能になります。
条件付き拡散
テキスト、画像、クラスなどの外部条件を統合して生成をガイドする拡散モデルの拡張。このアプローチにより、生成されるサンプルの特性を正確に制御できます。
ガイダンススケール
生成プロセスにおける条件の影響を制御するパラメータで、忠実性と創造性の間のトレードオフを調整できます。高いスケールは指示への追随を強化し、低いスケールは多様性を促進します。
段階的リサンプリング
複数のデノイジングサイクルを適用してディテールを洗練させ、アーティファクトを修正する反復的改善技術。この方法は計算時間を増やす代わりに、生成の最終的な品質を最適化します。
クロスセルフアテンション
拡散モデルがデノイジング中にテキスト情報と視覚情報を効率的に融合できるようにするアテンションメカニズム。このアーキテクチャは、テキストから画像への生成における意味的コヒーレンスにとって重要です。
DDIM(デノイジング拡散暗黙モデル)
少ないステップで品質を保ちながら高速なサンプリングを可能にする、拡散モデルの決定論的変種。DDIMは確率論的プロセスを非マルコフ的な決定論的マッピングに変換します。