AI用語集
人工知能の完全辞典
再パラメータ化トリック (Reparameterization Trick)
VAEのランダムサンプリングプロセスを微分可能にする技術で、確率変数を決定論的な部分と独立な確率的な部分に分解することで、勾配の逆伝播を容易にする。
変分下限 (ELBO)
VAEの最適化目標で、データの対数尤度からKLダイバージェンスを引いたものに相当し、観測データの尤度を最大化するための計算可能な代理関数として機能する。
潜在ダイナミクスモデル
潜在空間における状態遷移を学習するモデルで、現在の潜在状態と行動から次の潜在表現を予測し、環境のダイナミクスモデリングの複雑さを軽減する。
潜在空間での計画
エージェントが潜在ダイナミクスモデルを使用して未来の結果をシミュレーションし、実際の環境と直接対話することなく最適な行動シーケンスを探索する戦略。
ワールドモデル
知覚のためのVAE、状態予測のためのダイナミクスモデル(RNNまたはMDP)、およびこのシミュレートされた潜在空間で完全に動作する制御エージェントを組み合わせたアーキテクチャ。
近似事後分布 (q)
観測データを条件とする潜在変数の真の事後分布を近似する、エンコーダネットワークによってパラメータ化された分布で、推論を計算可能にする。
事前分布 (p)
潜在変数のために選ばれる分布で、通常は等方性の標準ガウス分布で、潜在空間を構造化し、過学習を防ぐための正則化項として機能する。
決定論的オートエンコーダと確率的オートエンコーダ
決定論的オートエンコーダが各入力を単一の潜在点にマッピングするのに対し、VAEのような確率的オートエンコーダは各入力を分布にマッピングし、不確実性を捉え、新しいデータの生成を可能にする。
ベータ係数 (β-VAE)
ELBO損失関数におけるKL正則化項の重み付けをするハイパーパラメータ。再構成品質と潜在因子の分離(ディスエンタングルメント)の度合いの間のトレードオフを制御します。
表現の分離(ディスエンタングルメント)
データ内の独立した意味的変動因子に各次元が解釈可能な形で対応する潜在空間の特性。モデルの一般化と解釈可能性を向上させます。
潜在遷移モデル
現在の潜在状態と適用された行動に基づいて次の潜在状態の分布を予測するワールドモデルの構成要素。プランナーのためのイメージシミュレーション(想像)の基礎を形成します。
制御エージェント(コントローラー)
行動決定を行うポリシーまたはニューラルネットワーク。ワールドモデルの枠組みでは、実際の環境からではなく潜在空間で生成された経験を使用してトレーニングされます。