AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
シーケンスモデリング
強化学習を系列モデリング問題として形式化するアプローチで、状態、行動、報酬が時間系列のトークンとして扱われる。
用語
時間差分トランスフォーマー
注意機構に時間差分の原理を組み込んだトランスフォーマーの変種で、系列学習と価値推定のブートストラップ更新を統合する。
用語
軌道条件付け
軌道生成器が部分的な軌道セグメントや特定の目標に条件付けされる技術で、生成される行動の精密な制御を可能にする。
用語
多段階予測
トランスフォーマーモデルが軌道の複数の将来ステップを同時に予測する能力で、生成される状態-行動-報酬系列の長期的な一貫性を向上させる。
用語
分布強化学習
リターンの期待値だけでなく完全な分布をモデル化する強化学習の拡張で、軌道予測における不確実性を捉える。
用語
注意ベース軌道埋め込み
注意メカニズムによって得られる軌道のベクトル表現で、連続する状態、行動、報酬間の複雑な時間的依存関係を捉える。
🔍