Glossário IA
O dicionário completo da Inteligência Artificial
MARL (Multi-Agent Reinforcement Learning)
Paradigma de aprendizagem onde múltiplos agentes interagem simultaneamente em um ambiente compartilhado, aprendendo políticas ótimas individualmente ou coletivamente.
Centralized Training with Decentralized Execution (CTDE)
Abordagem onde os agentes treinam usando informações globais centralizadas mas executam suas políticas de forma descentralizada com observações locais.
QMIX (Q-value Mixing)
Algoritmo de decomposição do valor Q que representa o valor Q conjunto como uma combinação não-linear monotônica dos valores Q individuais dos agentes.
VDN (Value Decomposition Networks)
Método de fatoração do valor total que decompõe o valor conjunto na soma dos valores individuais de cada agente em um cenário cooperativo.
MADDPG (Multi-Agent Deep Deterministic Policy Gradient)
Extensão do DDPG para ambientes multi-agentes usando treinamento centralizado com execução descentralizada para ambientes mistos.
COMA (Counterfactual Multi-Agent Policy Gradients)
Algoritmo que usa bases contrafactuais para estimar como as ações individuais afetam a recompensa global ao modificar a política de um agente mantendo os outros fixos.
Dec-POMDP (Decentralized Partially Observable Markov Decision Process)
Formalização matemática de problemas de decisão sequencial multi-agentes com observação parcial e tomada de decisão descentralizada.
Credit Assignment
Problema fundamental consistindo em determinar a contribuição de cada agente para a recompensa coletiva em ambientes multi-agentes cooperativos.
Aprendizagem de Ação Conjunta
Técnica onde os agentes aprendem a coordenar suas ações considerando as ações simultâneas de todos os agentes no ambiente.
Modelagem de Agente
Capacidade de um agente construir e manter modelos mentais das intenções, crenças e políticas dos outros agentes no ambiente.
Teoria do Campo Médio em MARL
Abordagem teórica que trata as interações multi-agentes em grande escala aproximando a influência coletiva por um campo médio estatístico.
Modelagem de Oponente
Processo de aprendizagem das estratégias e comportamentos dos agentes adversários para antecipar suas ações e otimizar sua própria política em jogos competitivos.
Protocolos de Comunicação em MARL
Mecanismos que permitem aos agentes trocar informações para melhorar a coordenação e a eficiência coletiva em tarefas cooperativas.
MARL Cooperativo
Subdomínio do MARL onde os agentes compartilham um objetivo comum e maximizam uma recompensa coletiva através da coordenação e colaboração.
MARL Competitivo
Estrutura multi-agentes onde indivíduos ou equipes competem em jogos de soma zero ou não-zero para maximizar suas recompensas individuais.
MARL de Motivos Mistos
Ambientes multi-agentes que combinam elementos cooperativos e competitivos, onde os agentes devem equilibrar interesses pessoais e objetivos coletivos.
Comportamento Emergente
Comportamentos complexos não programados que surgem espontaneamente da interação entre agentes aprendizes em um ambiente compartilhado.
Mecanismos de Atenção em MARL
Técnicas que permitem aos agentes ponderar seletivamente informações provenientes de outros agentes ou partes do ambiente para uma melhor tomada de decisão.
Aprendizagem por Currículo em MARL
Estratégia de treinamento que progride de tarefas simples para complexas para facilitar o aprendizado de políticas robustas em ambientes multi-agentes.
Escalabilidade em MARL
Desafio algorítmico consistindo em manter o desempenho de aprendizagem diante do aumento exponencial do espaço de ação conjunto com o número de agentes.