Glossário IA

O dicionário completo da Inteligência Artificial

242

categorias

3.306

subcategorias

39.932

termos

📖

termos

Aprendizagem por Reforço Multiagente

Paradigma de aprendizagem onde múltiplos agentes aprendem simultaneamente a tomar decisões em um ambiente compartilhado, interagindo entre si para otimizar objetivos coletivos ou individuais.

📖

termos

Gradiente de Política Determinística Profunda Multiagente (MADDPG)

Algoritmo CTDE que estende o DDPG para ambientes multiagentes, utilizando críticos centralizados e atores descentralizados para aprender em espaços de ação contínuos.

📖

termos

Processo de Decisão de Markov Parcialmente Observável Multiagente (MPOMDP)

Formalização matemática de ambientes MARL onde cada agente possui observações parciais e deve inferir o estado global para tomar decisões ótimas.

📖

termos

Jogos de Campo Médio

Teoria que estuda as interações de um grande número de agentes racionais aproximando o efeito da multidão por um campo médio, aplicável a sistemas multiagentes em larga escala.

📖

termos

Controle Contínuo

Domínio de aplicação do MARL onde os agentes devem controlar sistemas físicos com ações contínuas, como robótica móvel ou manipulação de objetos.

📖

termos

Jogos Estocásticos

Extensão dos MDPs para ambientes multiagentes onde as transições e recompensas dependem das ações conjuntas de todos os agentes, modelando cenários cooperativos e competitivos.

📖

termos

Equilíbrio de Nash no MARL

Conceito de estabilidade onde nenhum agente pode melhorar sua recompensa alterando unilateralmente sua estratégia, usado como critério de convergência em algoritmos MARL competitivos.

📖

termos

Protocolos de Coordenação

Mecanismos de comunicação ou sincronização que permitem aos agentes alinhar suas ações para atingir objetivos coletivos em ambientes MARL contínuos.

🔍

Glossário IA

Aprendizagem por Reforço Multiagente

Gradiente de Política Determinística Profunda Multiagente (MADDPG)

Processo de Decisão de Markov Parcialmente Observável Multiagente (MPOMDP)

Jogos de Campo Médio

Controle Contínuo

Jogos Estocásticos

Equilíbrio de Nash no MARL

Protocolos de Coordenação

Nenhum resultado encontrado