🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Aprendizagem por Reforço Multiagente

Paradigma de aprendizagem onde múltiplos agentes aprendem simultaneamente a tomar decisões em um ambiente compartilhado, interagindo entre si para otimizar objetivos coletivos ou individuais.

📖
termos

Gradiente de Política Determinística Profunda Multiagente (MADDPG)

Algoritmo CTDE que estende o DDPG para ambientes multiagentes, utilizando críticos centralizados e atores descentralizados para aprender em espaços de ação contínuos.

📖
termos

Processo de Decisão de Markov Parcialmente Observável Multiagente (MPOMDP)

Formalização matemática de ambientes MARL onde cada agente possui observações parciais e deve inferir o estado global para tomar decisões ótimas.

📖
termos

Jogos de Campo Médio

Teoria que estuda as interações de um grande número de agentes racionais aproximando o efeito da multidão por um campo médio, aplicável a sistemas multiagentes em larga escala.

📖
termos

Controle Contínuo

Domínio de aplicação do MARL onde os agentes devem controlar sistemas físicos com ações contínuas, como robótica móvel ou manipulação de objetos.

📖
termos

Jogos Estocásticos

Extensão dos MDPs para ambientes multiagentes onde as transições e recompensas dependem das ações conjuntas de todos os agentes, modelando cenários cooperativos e competitivos.

📖
termos

Equilíbrio de Nash no MARL

Conceito de estabilidade onde nenhum agente pode melhorar sua recompensa alterando unilateralmente sua estratégia, usado como critério de convergência em algoritmos MARL competitivos.

📖
termos

Protocolos de Coordenação

Mecanismos de comunicação ou sincronização que permitem aos agentes alinhar suas ações para atingir objetivos coletivos em ambientes MARL contínuos.

🔍

Nenhum resultado encontrado