🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📂
subcategorías

Procesos de Decisión de Markov Estocásticos

MDP donde las transiciones y recompensas siguen distribuciones probabilísticas, modelando la incertidumbre ambiental.

17 términos
📂
subcategorías

Métodos Monte Carlo en RL

Algoritmos que utilizan muestreo aleatorio repetido para estimar los valores de estado-acción en entornos estocásticos.

14 términos
📂
subcategorías

Políticas Estocásticas

Estrategias que devuelven distribuciones de probabilidad sobre las acciones en lugar de acciones deterministas.

11 términos
📂
subcategorías

Aprendizaje por Refuerzo Bayesiano

Enfoque que aborda la incertidumbre sobre los parámetros del modelo utilizando distribuciones de probabilidad.

9 términos
📂
subcategorías

Bandidos Estocásticos Multi-brazos

Problema de exploración-explotación donde cada brazo tiene una distribución de recompensa estocástica desconocida.

7 términos
📂
subcategorías

Métodos Bootstrap en RL

Técnicas que utilizan el remuestreo para cuantificar la incertidumbre en las estimaciones de valor.

15 términos
📂
subcategorías

Procesos Gaussianos para RL

Uso de procesos gaussianos para modelar la incertidumbre en la función de valor o de transición.

10 términos
📂
subcategorías

Métodos de Conjunto en RL Estocástico

Combinación de múltiples estimadores para capturar la incertidumbre epistémica en el aprendizaje.

19 términos
📂
subcategorías

Aprendizaje por Refuerzo Distribucional

Aprendizaje de la distribución completa de los retornos en lugar de solo su esperanza matemática.

5 términos
📂
subcategorías

Regresión Cuantil DRL

Enfoque específico del RL distribucional utilizando la regresión cuantil para modelar la incertidumbre.

8 términos
📂
subcategorías

MDP Parcialmente Observables Estocásticos

Extensión de los MDP estocásticos con observación parcial, aumentando la incertidumbre sobre el estado.

8 términos
📂
subcategorías

Optimización Estocástica en RL

Métodos de optimización que consideran el ruido y la incertidumbre en los gradientes y las actualizaciones.

10 términos
🔍

No se encontraron resultados