🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📂
subcategorias

Conservative Q-Learning (CQL)

Método que penaliza valores Q superestimados para manter a política próxima da distribuição dos dados.

18 termos
📂
subcategorias

Batch Constrained Q-learning (BCQ)

Abordagem que restringe as ações a permanecerem próximas às observadas no conjunto de dados para evitar o desvio de distribuição.

17 termos
📂
subcategorias

Decision Transformer

Arquitetura transformer que trata a aprendizagem por reforço offline como um problema de sequência a sequência.

11 termos
📂
subcategorias

Aprendizagem Q Implícita (IQL)

Método que aprende implicitamente a função Q sem a necessidade de um operador max explícito.

13 termos
📂
subcategorias

RL Offline Baseado em Modelo

Abordagem que utiliza modelos aprendidos do ambiente para melhorar a amostragem fora da distribuição.

10 termos
📂
subcategorias

Transferência de Aprendizagem Offline para Online

Técnicas para transferir eficientemente as aprendizagens offline para configurações online.

6 termos
📂
subcategorias

RL Offline Distributionnel

Métodos que modélisent a distribuição completa dos retornos em vez de apenas sua esperança matemática.

13 termos
📂
subcategorias

Aprendizagem por Reforço Offline Segura

Abordagens que garantem a segurança na implantação de políticas aprendidas exclusivamente com dados estáticos.

11 termos
📂
subcategorias

RL Offline Ciente da Incerteza

Métodos que quantificam a incerteza epistêmica para evitar ações fora da distribuição.

17 termos
📂
subcategorias

Trajectory Transformer

Modelo transformer que gera trajetórias completas aprendendo a distribuição das sequências estado-ação-recompensa.

6 termos
📂
subcategorias

Regressão Ponderada por Vantagem (AWR)

Abordagem que pondera as regressões com base na vantagem para melhorar a seleção de ações fora da distribuição.

11 termos
📂
subcategorias

Aprendizagem por Reforço Multitarefa Offline

Paradigma de aprendizagem simultânea de múltiplas tarefas a partir de conjuntos de dados em lote partilhados.

18 termos
🔍

Nenhum resultado encontrado