Масштабируемость в MARL
Алгоритм QMIX
Алгоритм многoагентного Q-обучения, гарантирующий монотонность между индивидуальными и совместными значениями, обеспечивая стабильное обучение в системах большого размера.
← Назад