想像による学習
モデル誘導型探索
内部モデルの予測を使用して試す価値のある最も有望な行動を特定する探索戦略。エージェントは、高い不確実性または高い報酬ポテンシャルを持つ状態に至るシミュレーションを優先します。
← 戻る内部モデルの予測を使用して試す価値のある最も有望な行動を特定する探索戦略。エージェントは、高い不確実性または高い報酬ポテンシャルを持つ状態に至るシミュレーションを優先します。
← 戻る