AI用語集
人工知能の完全辞典
分類誘導(Classifier-Free Guidance)
条件付きモデルと無条件モデルの予測を組み合わせて、生成に対する条件の影響を強化する条件忠実性向上技術
条件エンコーディング
入力条件(テキスト、画像など)をベクトル表現に変換し、拡散ネットワークに組み込んで生成プロセスに影響を与えるプロセス
テキストから画像生成(Text-to-Image)
条件がテキスト記述であり、それに対応する画像を同期的に生成する条件付き拡散の応用
画像から画像生成(Image-to-Image)
ソース画像を条件として使用し、新しい画像を生成する条件付き拡散タスク。スタイル変換、色付け、修正などの応用が多い
ControlNet
事前学習済み拡散モデルの重みを複製・固定し、深度マップやスケッチなどの空間的条件を解釈する層を追加するニューラルネットワークアーキテクチャ
負の埋め込み(Negative Embedding)
生成で避けるべきものを記述した条件をモデルに提供し、出力内容の制御を精密化する技術
条件付きインペインティング
部分的にマスクされた画像を条件として、モデルが欠落領域を文脈と一貫性を持って埋める条件付き拡散の形式
アウトペインティング
既存画像の境界を拡張し、元の画像を条件として使用して一貫性のある新しいコンテンツを生成する条件付き拡散プロセス
条件変調
AdaIN(適応的インスタンス正規化)層などを通じて、特徴量統計を条件に適合させるために、拡散モデルに条件を統合する方法。
条件忠実度スコア
条件付き拡散モデルによって生成された出力が、提供された入力条件とどの程度整合しているかを評価する指標。
DreamBooth
特定の概念や主題(しばしば人物や物体)を生成することを学習させるために、少数の画像セットで条件付き拡散モデルをファインチューニングする技術。
テキスト逆転
画像セットから新しいテキスト埋め込みトークンを学習するプロセス。拡散モデルにおいて、単一の単語を特定の視覚的スタイルや概念に関連付けることを可能にする。
IP-Adapter(画像プロンプトアダプター)
参照画像をエンコードし、クロスアテンション機構を通じて統合することで、拡散モデルが画像をプロンプトとして使用できるようにする追加モジュール。
マルチモーダル参照
生成をガイドするために複数のタイプの条件(例:テキストと画像)を同時に使用し、最終結果に対してより微妙で正確な制御を提供する。