モデルベースの好奇心に基づく学習
内在的好奇心モジュール(ICM)
特徴空間における次の状態を予測するモジュールと、アクションを予測する逆モジュールを組み合わせた特定のニューラルネットワークアーキテクチャ。フォワードモジュールの予測誤差は内在的報酬として使用されます。
← 戻る特徴空間における次の状態を予測するモジュールと、アクションを予測する逆モジュールを組み合わせた特定のニューラルネットワークアーキテクチャ。フォワードモジュールの予測誤差は内在的報酬として使用されます。
← 戻る