マルチモーダル模倣学習

📖

用語

マルチモーダル模倣学習

同じタスクに対して複数の有効な解決策を示すデモンストレーションからエージェントが学習する学習パラダイム。専門家の行動の多様性を捉える。

📖

用語

マルチモーダル方策分布

複数の明確なモードを含む方策の確率的表現。各モードは同じ目標を達成するための異なる解決戦略に対応する。

📖

用語

行動モード

マルチモーダル分布内の特定の行動構成。タスクを実行するための明確で一貫した方法を表す。

📖

用語

デモンストレーションの集約

異なる戦略からの学習軌道を知的に組み合わせて、多モーダル性を維持しながら統一された方策を構築するプロセス。

📖

用語

方策のためのガウス混合モデル

マルチモーダル方策を複数のガウス分布の重み付き組み合わせとして表現するパラメトリックモデル。各ガウス分布は行動モードに対応する。

📖

用語

軌道の事後分布

初期状態と目標が与えられた場合の可能な軌道に関する条件付き分布。目標に到達するための異なる方法に関する不確実性を捉える。

📖

用語

行動潜在空間

各点が個別の行動戦略を符号化する圧縮表現。異なる行動モード間のナビゲーションと補間を可能にする。

📖

用語

デモンストレーションのクラスタリング

模倣データに存在する異なる行動モードを特定・分離するために、類似の軌道を自動的にグループ化する手法。

📖

用語

モダリティ-行動の分離

モダリティ選択と特定のアクション生成を別々のコンポーネントで処理し、マルチモーダルモデリングを向上させるアーキテクチャ。

📖

用語

モード推論

文脈とエージェントの嗜好に基づき、特定の状況で使用する適切な行動モードを識別するプロセス。

📖

用語

条件付きポリシー

現在の状態と選択されたモード識別子の両方に条件付けられたアクションを生成し、採用する戦略の明示的制御を可能にするポリシー。

📖

用語

最適解選択

効率性、堅牢性、文脈的制約などの基準に基づいて、複数の有効な代替案の中から最適なソリューションを評価・選択するメカニズム。

📖

用語

行動分散

各モード周りのアクションや軌跡の分散を定量化する統計的測定値。モード内の変動性とマルチモーダリティを区別する。

📖

用語

モード融合

複数の行動モードを組み合わせて新しいハイブリッド戦略を作成し、各個別モードの強みを活用する技術。

📖

用語

サブポリシー学習

各モードを専門的なサブポリシーとしてモデル化し、全体的なマルチモーダルアーキテクチャに統合される前に独立して学習させるアプローチ。

📖

用語

ソリューション階層

異なる有効なソリューションの組織構造。通常、複雑さ、効率性、または最適な適用文脈に基づいている。

📖

用語

モードガイド付き探索

選択された行動モードとの一貫性を維持しながら、そのモード内で新しい有効なバリエーションを発見する探索戦略。

📖

用語

モード間転移

ある行動モードで獲得した知識を、類似の別のモードでの学習や実行を改善するために転移させる能力。

📖

用語

マルチモーダル評価

平均的なパフォーマンスだけでなく、学習されたさまざまな行動モードのカバレッジと品質も考慮に入れる評価指標。

AI用語集