マルチエージェント探査
最大多様性探索
エージェント集団の探索軌跡の多様性を最大化し、状態-行動空間を効率的にカバーすることを目指す戦略。エージェントは、グループですでに探索された状態に対して独自の状態を発見することで報酬を受ける。
← 戻るエージェント集団の探索軌跡の多様性を最大化し、状態-行動空間を効率的にカバーすることを目指す戦略。エージェントは、グループですでに探索された状態に対して独自の状態を発見することで報酬を受ける。
← 戻る