AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
サブカテゴリ
ビヘイビアルクローニング
エージェントの行動と専門家のデモンストレーションとの誤差を最小化することにより、方策を直接学習すること
17 用語
サブカテゴリ
逆強化学習
専門家のデモンストレーションから報酬関数を推論し、最適なポリシーを学習する。
14 用語
サブカテゴリ
生成的敵対的模倣学習
エージェントの行動と専門家のデモンストレーションを区別するための敵対的ネットワークの利用
18 用語
サブカテゴリ
DAggerデータ集約
現在のポリシーが訪れた状態について専門家に問い合わせながらデータを反復的に収集する。
17 用語
サブカテゴリ
オフライン模倣学習
環境との追加的な相互作用なしに、固定されたデモンストレーションのセットから学習すること。
13 用語
サブカテゴリ
オンライン模倣学習
リアルタイムの対話と新しいデモンストレーションに基づく更新による継続的学習
15 用語
サブカテゴリ
観察による模倣
専門家のアクションにアクセスせず、状態と軌道のみを観察することで学習する
15 用語
サブカテゴリ
階層的模倣学習
異なる抽象度のレベルでの模倣学習による、複雑なタスクをサブタスクへの分解。
17 用語
サブカテゴリ
ワンショット模倣学習
一度のデモンストレーションを観察した後に新しいタスクを模倣する能力。
11 用語
サブカテゴリ
模倣によるメタ学習
複数のタスクを通じた経験から、模倣によって迅速に新しいタスクを学ぶ学習方法。
20 用語
サブカテゴリ
マルチモーダル模倣学習
複数の有効な解を持つデモンストレーションの管理とマルチモーダル方策の学習
19 用語
サブカテゴリ
部分的観測を伴う模倣学習
デモンストレーションが状態空間を部分的にしかカバーしていない場合の模倣学習
10 用語
🔍