🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Política de Planejamento (Planning Policy)

Função ou estratégia que mapeia cada estado do ambiente para uma ação específica, definindo o comportamento do agente para atingir objetivos de planejamento ótimos.

📖
termos

Modelagem de Recompensa (Reward Shaping)

Técnica de design de recompensas que modifica a função de recompensa original para guiar mais eficazmente o agente em direção a comportamentos de planejamento desejáveis.

📖
termos

Planejamento Hierárquico por RL (Hierarchical RL Planning)

Abordagem onde a política de planejamento é decomposta em uma hierarquia de subtarefas ou subpolíticas, permitindo resolver problemas de planejamento complexos de maneira mais eficiente.

📖
termos

Meta-Aprendizagem para Planejamento (Meta-Learning for Planning)

Paradigma onde o agente aprende a aprender políticas de planejamento adaptativas que podem se ajustar rapidamente a novos ambientes ou objetivos de planejamento.

📖
termos

Planejamento Multiagente por RL (Multi-Agent RL Planning)

Extensão do RL para cenários onde múltiplos agentes aprendem simultaneamente políticas de planejamento, exigindo a consideração das interações e da cooperação/competição entre agentes.

📖
termos

Planejamento Robusto por RL (Robust RL Planning)

Abordagem que visa aprender políticas de planejamento que mantêm seu desempenho diante de incertezas e variações do ambiente ou do modelo de dinâmica.

📖
termos

Transferência de Aprendizagem em Planejamento RL (Transfer Learning in RL Planning)

Técnica que permite reutilizar conhecimentos ou políticas aprendidas em um contexto de planejamento para acelerar a aprendizagem em um novo contexto similar.

📖
termos

Planejamento por RL com Restrições (Constrained RL Planning)

Formulação de RL onde o agente deve otimizar sua política de planejamento enquanto respeita restrições de segurança, recursos ou outras limitações específicas do domínio.

📖
termos

Aprendizagem por Reforço Baseada em Modelo (RL Baseado em Modelo)

Abordagem onde o agente aprende ou utiliza um modelo explícito da dinâmica do ambiente para melhorar seu planejamento e tomada de decisão, ao contrário do RL sem modelo.

📖
termos

Planejamento Contínuo por RL (Planejamento Contínuo de RL)

Especialização do RL para problemas de planejamento onde os espaços de estados e ações são contínuos, exigindo técnicas de aproximação específicas como os atores-críticos.

📖
termos

Episódio de Planejamento (Episódio de Planejamento)

Sequência completa de interações entre o agente e o ambiente desde um estado inicial até um estado terminal, constituindo uma unidade de aprendizagem para a política de planejamento.

📖
termos

Planejamento por RL com Aprendizagem por Imitação (Aprendizagem por Imitação para Planejamento de RL)

Método onde o agente aprende uma política de planejamento imitando demonstrações de especialistas, frequentemente usado para inicializar ou guiar a aprendizagem por reforço.

📖
termos

Otimização de Política por RL (Otimização de Política)

Classe de algoritmos de RL que otimizam diretamente os parâmetros da política de planejamento para maximizar a recompensa esperada, incluindo métodos como REINFORCE ou PPO.

🔍

Nenhum resultado encontrado