Escalabilidad en MARL
QMIX Algorithm
Algoritmo de Q-learning multi-agente que garantiza la monotonicidad entre los valores individuales y el valor conjunto, permitiendo un aprendizaje estable en sistemas de gran tamaño.
← Volver