Multi-Agent Deep RL - Glossário IA

📖

termos

MARL (Multi-Agent Reinforcement Learning)

Paradigma de aprendizagem onde múltiplos agentes interagem simultaneamente em um ambiente compartilhado, aprendendo políticas ótimas individualmente ou coletivamente.

📖

termos

Centralized Training with Decentralized Execution (CTDE)

Abordagem onde os agentes treinam usando informações globais centralizadas mas executam suas políticas de forma descentralizada com observações locais.

📖

termos

QMIX (Q-value Mixing)

Algoritmo de decomposição do valor Q que representa o valor Q conjunto como uma combinação não-linear monotônica dos valores Q individuais dos agentes.

📖

termos

VDN (Value Decomposition Networks)

Método de fatoração do valor total que decompõe o valor conjunto na soma dos valores individuais de cada agente em um cenário cooperativo.

📖

termos

MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

Extensão do DDPG para ambientes multi-agentes usando treinamento centralizado com execução descentralizada para ambientes mistos.

📖

termos

COMA (Counterfactual Multi-Agent Policy Gradients)

Algoritmo que usa bases contrafactuais para estimar como as ações individuais afetam a recompensa global ao modificar a política de um agente mantendo os outros fixos.

📖

termos

Dec-POMDP (Decentralized Partially Observable Markov Decision Process)

Formalização matemática de problemas de decisão sequencial multi-agentes com observação parcial e tomada de decisão descentralizada.

📖

termos

Credit Assignment

Problema fundamental consistindo em determinar a contribuição de cada agente para a recompensa coletiva em ambientes multi-agentes cooperativos.

📖

termos

Aprendizagem de Ação Conjunta

Técnica onde os agentes aprendem a coordenar suas ações considerando as ações simultâneas de todos os agentes no ambiente.

📖

termos

Modelagem de Agente

Capacidade de um agente construir e manter modelos mentais das intenções, crenças e políticas dos outros agentes no ambiente.

📖

termos

Teoria do Campo Médio em MARL

Abordagem teórica que trata as interações multi-agentes em grande escala aproximando a influência coletiva por um campo médio estatístico.

📖

termos

Modelagem de Oponente

Processo de aprendizagem das estratégias e comportamentos dos agentes adversários para antecipar suas ações e otimizar sua própria política em jogos competitivos.

📖

termos

Protocolos de Comunicação em MARL

Mecanismos que permitem aos agentes trocar informações para melhorar a coordenação e a eficiência coletiva em tarefas cooperativas.

📖

termos

MARL Cooperativo

Subdomínio do MARL onde os agentes compartilham um objetivo comum e maximizam uma recompensa coletiva através da coordenação e colaboração.

📖

termos

MARL Competitivo

Estrutura multi-agentes onde indivíduos ou equipes competem em jogos de soma zero ou não-zero para maximizar suas recompensas individuais.

📖

termos

MARL de Motivos Mistos

Ambientes multi-agentes que combinam elementos cooperativos e competitivos, onde os agentes devem equilibrar interesses pessoais e objetivos coletivos.

📖

termos

Comportamento Emergente

Comportamentos complexos não programados que surgem espontaneamente da interação entre agentes aprendizes em um ambiente compartilhado.

📖

termos

Mecanismos de Atenção em MARL

Técnicas que permitem aos agentes ponderar seletivamente informações provenientes de outros agentes ou partes do ambiente para uma melhor tomada de decisão.

📖

termos

Aprendizagem por Currículo em MARL

Estratégia de treinamento que progride de tarefas simples para complexas para facilitar o aprendizado de políticas robustas em ambientes multi-agentes.

📖

termos

Escalabilidade em MARL

Desafio algorítmico consistindo em manter o desempenho de aprendizagem diante do aumento exponencial do espaço de ação conjunto com o número de agentes.

Glossário IA

MARL (Multi-Agent Reinforcement Learning)

Centralized Training with Decentralized Execution (CTDE)

QMIX (Q-value Mixing)

VDN (Value Decomposition Networks)

MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

COMA (Counterfactual Multi-Agent Policy Gradients)

Dec-POMDP (Decentralized Partially Observable Markov Decision Process)

Credit Assignment

Aprendizagem de Ação Conjunta

Modelagem de Agente

Teoria do Campo Médio em MARL

Modelagem de Oponente

Protocolos de Comunicação em MARL

MARL Cooperativo

MARL Competitivo

MARL de Motivos Mistos

Comportamento Emergente

Mecanismos de Atenção em MARL

Aprendizagem por Currículo em MARL

Escalabilidade em MARL

Nenhum resultado encontrado