Централизованно-децентрализованное MARL
Проблема нестационарности
Сложность в MARL, где воспринимаемая каждым агентом среда постоянно меняется, поскольку другие агенты адаптируют свои политики. Эта проблема требует специальных алгоритмов, таких как CTDE, для поддержания сходимости.
← Назад