AI用語集
人工知能の完全辞典
OpenPose
リアルタイムの身体ポーズ検出システムで、関節のキーポイントを抽出し、拡散モデルが正確な人間の姿勢を尊重する画像を生成するための条件として使用されます。
Canny Edge Detection
画像内の強い強度変動を識別する多段階のエッジ検出アルゴリズムで、拡散モデルの空間制御マップとして幾何学的構造を保持するために使用されます。
Scribble Map
拡散モデルによって生成される画像の構成と基本的な形状を導く、単純なスケッチまたは粗い線の形をした制御条件です。
Depth Map
シーンの3D深度情報の2D表現で、各ピクセルが基準平面からの距離をエンコードし、生成における遠近法と空間的配置を制御するために使用されます。
MLSD (Mobile Line Segment Detector)
モバイルデバイス用に最適化された線分検出器で、画像から線形構造を抽出し、生成において建築と遠近法を保持するための条件として機能します。
HED (Holistically-Nested Edge Detection)
オブジェクトの階層構造をキャプチャする深層ニューラルネットワークに基づくエッジ検出手法で、従来のエッジ検出器よりも意味論的な制御を提供します。
T2I-Adapter (Text-to-Image Adapter)
空間制御条件をテキストから画像への拡散モデルに接続する軽量モジュールで、モデルの元の生成能力を保持しながら精密な制御を可能にします。
Reference-Only Control
構造を直接変更せずに特徴を抽出するために参照画像のみを使用する制御技術で、構成を保持しながらスタイルを転送します。
ControlLoRA
LoRA(Low-Rank Adaptation)アーキテクチャとControlNetを組み合わせたもので、最小限の訓練可能パラメータで効率的な条件付き制御を可能にします。
SparseCtrl
スパースな条件(キーポイント、バウンディングボックス)を使用して生成をガイドする制御手法で、密な制御マップよりも軽量な代替手段を提供します。
UniControl
複数の条件(テキスト、姿勢、深度など)を単一の拡散モデルで同時に制御できる統合フレームワークで、別々のトレーニングの必要性を排除します。
ControlNet-XS
元のパラメータの1%未満を使用しながら、同等の制御性能を維持するControlNetの極めて軽量な変種です。
Multi-ControlNet
複数の制御条件(例:姿勢 + 深度 + スタイル)を同時に適用して、画像生成の多次元的なガイダンスを可能にするアーキテクチャです。
ControlNet Preprocessor
生の入力(画像、スケッチ)を拡散モデルの潜在空間と互換性のある正規化された制御マップに変換する処理モジュールです。
Control Weight
拡散モデルの生成プロセスにおいて、制御条件のテキストプロンプトに対する相対的な影響を決定する調整可能なパラメータです。