AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
サブカテゴリ
Behavioral Cloning
専門家のデモンストレーションから直接行動を模倣する教師あり学習。
13 用語
サブカテゴリ
逆強化学習
観察された専門家の行動から最適な報酬関数を推論する。
6 用語
サブカテゴリ
生成的敵対的模倣学習
エージェントの行動と専門家の行動を区別するために敵対的ネットワークを使用します。
12 用語
サブカテゴリ
Dataset Aggregation (DAgger)
エージェントの軌道上で専門家から新しいデータを収集し、ポリシーを改善する反復的な手法。
19 用語
サブカテゴリ
人間のフィードバックからの報酬学習
人間が提供する比較的または質的な評価から報酬を学習する。
14 用語
サブカテゴリ
オフライン強化学習
環境との相互作用なしに固定されたデータセットのみを使用する強化学習。
9 用語
サブカテゴリ
モデルベース模倣学習
環境の動的モデルを構築し、模倣学習を加速させる。
10 用語
サブカテゴリ
メタ模倣学習
わずかなデモンストレーションで新しいタスクを素早く模倣することを学ぶ。
17 用語
サブカテゴリ
階層的模倣学習
複雑な行動を模倣しやすいサブタスクの階層に分解する。
10 用語
サブカテゴリ
マルチモーダル模倣学習
同じタスクに対して複数の有効な解決策を扱い、行動の分布を学習する。
9 用語
サブカテゴリ
自己模倣学習
エージェントは過去の成功した行動を模倣することで、現在の方策を改善します。
17 用語
サブカテゴリ
目標条件付き模倣学習
特定の目標に基づいて様々なタスクを達成するためのポリシーを学習する。
15 用語
サブカテゴリ
逆強化学習への敵対的アプローチ
より頑健な報酬推定のために、逆強化学習と敵対的学習を組み合わせる。
12 用語
サブカテゴリ
部分観察における模倣学習
エージェントが状態の一部のみを観察する環境での模倣学習
14 用語
サブカテゴリ
カリキュラム模倣学習
学習を促進するための難易度が段階的に増加するデモンストレーションの進行シーケンス。
14 用語
🔍