MARL Continu
マルチエージェント深層決定論的政策勾配法(MADDPG)
DDPGをマルチエージェント環境に拡張したCTDEアルゴリズム。集中化された批評家と分散化された行動者を使用し、連続行動空間での学習を実現する。
← 戻るDDPGをマルチエージェント環境に拡張したCTDEアルゴリズム。集中化された批評家と分散化された行動者を使用し、連続行動空間での学習を実現する。
← 戻る