🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📂
subcategorias

Processos de Decisão Markovianos Estocásticos

MDP onde as transições e recompensas seguem distribuições probabilísticas, modelando a incerteza ambiental.

17 termos
📂
subcategorias

Métodos Monte Carlo em RL

Algoritmos que utilizam amostragem aleatória repetida para estimar os valores de estado-ação em ambientes estocásticos.

14 termos
📂
subcategorias

Políticas Estocásticas

Estratégias que retornam distribuições de probabilidade sobre as ações em vez de ações determinísticas.

11 termos
📂
subcategorias

Aprendizagem por Reforço Bayesiana

Abordagem que trata a incerteza sobre os parâmetros do modelo usando distribuições de probabilidade.

9 termos
📂
subcategorias

Bandidos Estocásticos Multi-braços

Problema de exploração-explotação onde cada braço tem uma distribuição de recompensa estocástica desconhecida.

7 termos
📂
subcategorias

Métodos Bootstrap em RL

Técnicas que utilizam reamostragem para quantificar a incerteza nas estimativas de valor.

15 termos
📂
subcategorias

Processos Gaussianos para RL

Uso de processos gaussianos para modelar a incerteza na função de valor ou de transição.

10 termos
📂
subcategorias

Métodos de Ensemble em RL Estocástico

Combinação de múltiplos estimadores para capturar a incerteza epistêmica na aprendizagem.

19 termos
📂
subcategorias

Aprendizagem por Reforço Distribucional

Aprendizagem da distribuição completa dos retornos em vez de apenas sua esperança matemática.

5 termos
📂
subcategorias

Regressão Quantílica DRL

Abordagem específica de RL distribucional usando regressão quantílica para modelar a incerteza.

8 termos
📂
subcategorias

MDPs Parcialmente Observáveis Estocásticos

Extensão dos MDPs estocásticos com observação parcial, aumentando a incerteza sobre o estado.

8 termos
📂
subcategorias

Otimização Estocástica em RL

Métodos de otimização que consideram ruído e incerteza nos gradientes e atualizações.

10 termos
🔍

Nenhum resultado encontrado