MARL Centralizado-Descentralizado
MDP Parcialmente Observável Descentralizado (Dec-POMDP)
Formalização matemática de problemas de decisão multiagentes com observabilidade parcial onde cada agente toma decisões baseadas em suas observações locais. Os agentes devem cooperar para maximizar uma recompensa global compartilhada.
← Voltar