継続的階層的強化学習
サットンのオプション
原子的なアクションのシーケンスを再利用可能な巨視的な振る舞いに結合させる、持続的なアクションの時間単位であり、階層型強化学習における時間的抽象化の基礎を形成する。
← 戻る原子的なアクションのシーケンスを再利用可能な巨視的な振る舞いに結合させる、持続的なアクションの時間単位であり、階層型強化学習における時間的抽象化の基礎を形成する。
← 戻る