MARL Continuo
Proceso de Decisión de Markov Parcialmente Observable Multiagente (MPOMDP)
Formalización matemática de entornos MARL donde cada agente posee observaciones parciales y debe inferir el estado global para tomar decisiones óptimas.
← Volver