🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

MARL (Multi-Agent Reinforcement Learning)

Paradigma de aprendizagem onde múltiplos agentes interagem simultaneamente em um ambiente compartilhado, aprendendo políticas ótimas individualmente ou coletivamente.

📖
termos

Centralized Training with Decentralized Execution (CTDE)

Abordagem onde os agentes treinam usando informações globais centralizadas mas executam suas políticas de forma descentralizada com observações locais.

📖
termos

QMIX (Q-value Mixing)

Algoritmo de decomposição do valor Q que representa o valor Q conjunto como uma combinação não-linear monotônica dos valores Q individuais dos agentes.

📖
termos

VDN (Value Decomposition Networks)

Método de fatoração do valor total que decompõe o valor conjunto na soma dos valores individuais de cada agente em um cenário cooperativo.

📖
termos

MADDPG (Multi-Agent Deep Deterministic Policy Gradient)

Extensão do DDPG para ambientes multi-agentes usando treinamento centralizado com execução descentralizada para ambientes mistos.

📖
termos

COMA (Counterfactual Multi-Agent Policy Gradients)

Algoritmo que usa bases contrafactuais para estimar como as ações individuais afetam a recompensa global ao modificar a política de um agente mantendo os outros fixos.

📖
termos

Dec-POMDP (Decentralized Partially Observable Markov Decision Process)

Formalização matemática de problemas de decisão sequencial multi-agentes com observação parcial e tomada de decisão descentralizada.

📖
termos

Credit Assignment

Problema fundamental consistindo em determinar a contribuição de cada agente para a recompensa coletiva em ambientes multi-agentes cooperativos.

📖
termos

Aprendizagem de Ação Conjunta

Técnica onde os agentes aprendem a coordenar suas ações considerando as ações simultâneas de todos os agentes no ambiente.

📖
termos

Modelagem de Agente

Capacidade de um agente construir e manter modelos mentais das intenções, crenças e políticas dos outros agentes no ambiente.

📖
termos

Teoria do Campo Médio em MARL

Abordagem teórica que trata as interações multi-agentes em grande escala aproximando a influência coletiva por um campo médio estatístico.

📖
termos

Modelagem de Oponente

Processo de aprendizagem das estratégias e comportamentos dos agentes adversários para antecipar suas ações e otimizar sua própria política em jogos competitivos.

📖
termos

Protocolos de Comunicação em MARL

Mecanismos que permitem aos agentes trocar informações para melhorar a coordenação e a eficiência coletiva em tarefas cooperativas.

📖
termos

MARL Cooperativo

Subdomínio do MARL onde os agentes compartilham um objetivo comum e maximizam uma recompensa coletiva através da coordenação e colaboração.

📖
termos

MARL Competitivo

Estrutura multi-agentes onde indivíduos ou equipes competem em jogos de soma zero ou não-zero para maximizar suas recompensas individuais.

📖
termos

MARL de Motivos Mistos

Ambientes multi-agentes que combinam elementos cooperativos e competitivos, onde os agentes devem equilibrar interesses pessoais e objetivos coletivos.

📖
termos

Comportamento Emergente

Comportamentos complexos não programados que surgem espontaneamente da interação entre agentes aprendizes em um ambiente compartilhado.

📖
termos

Mecanismos de Atenção em MARL

Técnicas que permitem aos agentes ponderar seletivamente informações provenientes de outros agentes ou partes do ambiente para uma melhor tomada de decisão.

📖
termos

Aprendizagem por Currículo em MARL

Estratégia de treinamento que progride de tarefas simples para complexas para facilitar o aprendizado de políticas robustas em ambientes multi-agentes.

📖
termos

Escalabilidade em MARL

Desafio algorítmico consistindo em manter o desempenho de aprendizagem diante do aumento exponencial do espaço de ação conjunto com o número de agentes.

🔍

Nenhum resultado encontrado