MARL Continuo
Juegos Estocásticos
Extensión de los MDP a entornos multiagente donde las transiciones y las recompensas dependen de las acciones conjuntas de todos los agentes, modelando escenarios cooperativos y competitivos.
← Volver