🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Regresión Cuantil DRL

Enfoque de aprendizaje por refuerzo profundo que modela la distribución completa de los retornos esperados en lugar de solo su esperanza, utilizando la regresión cuantil para estimar los cuantiles de la distribución de valor.

📖
términos

Distancia de Wasserstein en DRL

Métrica de distancia entre distribuciones utilizada en el DRL distribucional para medir la disimilitud entre las distribuciones de retorno predichas y objetivo, favoreciendo una mejor estabilidad del aprendizaje.

📖
términos

Modelado de Distribución de Valor

Técnica que consiste en aproximar la distribución completa de los retornos esperados para cada estado-acción en lugar de solo su esperanza, capturando la incertidumbre y la variabilidad inherentes al entorno.

📖
términos

Regresión Expectil RL

Variante del DRL distribucional que utiliza la regresión expectil en lugar de cuantil, ofreciendo una asimetría controlable en la estimación de la distribución de retorno, particularmente adecuada para contextos sensibles al riesgo.

📖
términos

Distribución Probabilística de Retorno

Representación probabilística completa de los retornos futuros esperados para cada par estado-acción, caracterizando no solo la media sino también la varianza, la asimetría y otros momentos estadísticos.

📖
términos

Actualización Bellman Proyectada Distribucional

Procedimiento de actualización que proyecta la distribución de retorno objetivo sobre el espacio de distribuciones soportadas, asegurando la coherencia y estabilidad del aprendizaje en el marco distribucional.

📖
términos

Evaluación del Riesgo de Cola en DRL

Capacidad del DRL distribucional para evaluar cuantitativamente los riesgos extremos (riesgo de cola) analizando las colas de distribución de los retornos, crucial para aplicaciones críticas.

📖
términos

Estrategias de Muestreo Cuantil

Técnicas de muestreo de los cuantiles en el contexto del QR-DRL, incluyendo el muestreo uniforme, adaptativo o basado en la importancia para optimizar la eficiencia del aprendizaje de la distribución.

🔍

No se encontraron resultados