🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

RL Offline Baseado em Modelo

Abordagem de aprendizagem por reforço offline que aprende um modelo dinâmico do ambiente para gerar dados sintéticos e melhorar a política sem interação real.

📖
termos

Rollouts de Imaginação

Trajetórias simuladas geradas usando o modelo aprendido do ambiente para explorar potenciais estados futuros sem interação real com o ambiente.

📖
termos

Otimização Conservadora de Políticas

Algoritmo que penaliza explicitamente políticas que se desviam significativamente do comportamento dos dados de treinamento para evitar erros de extrapolação.

📖
termos

Quantificação de Incerteza

Técnica que permite estimar a incerteza do modelo dinâmico em regiões fora da distribuição para guiar a exploração e evitar erros catastróficos.

📖
termos

Modelos de Ensemble

Coleção de vários modelos dinâmicos treinados com diferentes inicializações para estimar a incerteza epistêmica pela variância das previsões.

📖
termos

Transformers de Trajetória

Arquitetura transformer que modela trajetórias como sequências de estados, ações e recompensas para prever transições futuras na aprendizagem offline.

📖
termos

Transferência Offline-para-Online

Processo de transferência de uma política aprendida offline para um ambiente online para refinamento e adaptação contínua com interação real.

📖
termos

Ensemble de Modelos

Técnica que utiliza múltiplos modelos dinâmicos para capturar diferentes hipóteses sobre a transição de estado e melhorar a robustez das previsões.

📖
termos

Regressão Ponderada por Vantagem

Método offline que pondera as ações nos dados de treinamento de acordo com sua vantagem estimada para melhorar a política além da simples clonagem.

📖
termos

Detecção Fora da Distribuição

Mecanismo para identificar quando os estados gerados pelo modelo se desviam significativamente da distribuição dos dados de treinamento originais.

🔍

Nenhum resultado encontrado