集中型-分散型MARL
マルチエージェント深層決定論的ポリシー勾配(MADDPG)
集中化された批判器と分散化された行動器を使用した集中-分散学習を活用して、DDPGをマルチエージェント環境に拡張したもの。各エージェントは、他のエージェントのポリシーを環境の一部として考慮しながらポリシーを学習する。
← 戻る集中化された批判器と分散化された行動器を使用した集中-分散学習を活用して、DDPGをマルチエージェント環境に拡張したもの。各エージェントは、他のエージェントのポリシーを環境の一部として考慮しながらポリシーを学習する。
← 戻る