MARL Adversarial
Враждебное обучение с подкреплением
Парадигма обучения с подкреплением, явно интегрирующая враждебных агентов в процесс обучения для повышения устойчивости и способностей к обобщению.
← Назад