Glossário IA
O dicionário completo da Inteligência Artificial
Aprendizagem por Reforço Multiagente
Paradigma de aprendizagem onde múltiplos agentes aprendem simultaneamente a tomar decisões em um ambiente compartilhado, interagindo entre si para otimizar objetivos coletivos ou individuais.
Gradiente de Política Determinística Profunda Multiagente (MADDPG)
Algoritmo CTDE que estende o DDPG para ambientes multiagentes, utilizando críticos centralizados e atores descentralizados para aprender em espaços de ação contínuos.
Processo de Decisão de Markov Parcialmente Observável Multiagente (MPOMDP)
Formalização matemática de ambientes MARL onde cada agente possui observações parciais e deve inferir o estado global para tomar decisões ótimas.
Jogos de Campo Médio
Teoria que estuda as interações de um grande número de agentes racionais aproximando o efeito da multidão por um campo médio, aplicável a sistemas multiagentes em larga escala.
Controle Contínuo
Domínio de aplicação do MARL onde os agentes devem controlar sistemas físicos com ações contínuas, como robótica móvel ou manipulação de objetos.
Jogos Estocásticos
Extensão dos MDPs para ambientes multiagentes onde as transições e recompensas dependem das ações conjuntas de todos os agentes, modelando cenários cooperativos e competitivos.
Equilíbrio de Nash no MARL
Conceito de estabilidade onde nenhum agente pode melhorar sua recompensa alterando unilateralmente sua estratégia, usado como critério de convergência em algoritmos MARL competitivos.
Protocolos de Coordenação
Mecanismos de comunicação ou sincronização que permitem aos agentes alinhar suas ações para atingir objetivos coletivos em ambientes MARL contínuos.