Escalabilidade em MARL
Algoritmo QMIX
Algoritmo de Q-learning multiagente que garante a monotonicidade entre os valores individuais e o valor conjunto, permitindo aprendizado estável em sistemas de grande porte.
← Voltar