🏠 Início
Avaliações
📊 Todos os Benchmarks 🦖 Dinossauro v1 🦖 Dinossauro v2 ✅ Aplicações To-Do List 🎨 Páginas Livres Criativas 🎯 FSACB - Showcase Definitivo 🌍 Benchmark de Tradução
Modelos
🏆 Top 10 Modelos 🆓 Modelos Gratuitos 📋 Todos os Modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de Prompts 📖 Glossário de IA 🔗 Links Úteis

Glossário IA

O dicionário completo da Inteligência Artificial

242
categorias
3.306
subcategorias
39.932
termos
📖
termos

Matriz de Informação de Fisher

Matriz que mede a quantidade de informação que uma variável aleatória observável carrega sobre um parâmetro desconhecido, utilizada no TRPO para definir a geometria do espaço de parâmetros.

📖
termos

Divergência KL

Medida de dissimilaridade entre duas distribuições de probabilidade, utilizada no TRPO como restrição para limitar o desvio entre políticas sucessivas.

📖
termos

Gradiente Conjugado

Algoritmo de otimização iterativo utilizado no TRPO para resolver eficientemente os sistemas lineares na direção de descida do gradiente natural.

📖
termos

Busca Linear

Procedimento de otimização que ajusta o tamanho do passo para garantir que a atualização respeite as restrições da região de confiança no TRPO.

📖
termos

Teoria da Melhoria Monotônica

Teoria que garante que uma política atualizada com TRPO sempre melhora ou mantém o desempenho esperado sob certas condições de região de confiança.

📖
termos

Recompensa-futura

Estimador da função de valor que utiliza apenas as recompensas futuras após um determinado passo de tempo para reduzir a variância na estimativa do gradiente.

📖
termos

Eficiência de Amostragem

Medida da eficiência de um algoritmo de aprendizado por reforço em utilizar os dados coletados, sendo o TRPO conhecido por sua boa eficiência de amostragem.

📖
termos

Aprendizado On-policy

Paradigma de aprendizado onde os dados coletados devem provir da política atual, uma característica fundamental do TRPO, ao contrário dos métodos off-policy.

🔍

Nenhum resultado encontrado