🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Distribución por Cuantiles Continos

Representación de la distribución de retorno como un conjunto de cuantiles evolutivos en los espacios de acción continuos, permitiendo una modelización fina de la incertidumbre y los riesgos.

📖
términos

Proyección Cramer-Wold Distributional

Técnica matemática que permite comparar distribuciones proyectando sobre direcciones unidimensionales, esencial para las métricas distributionales en RL continuo.

📖
términos

Red de Distribución Atómica

Arquitectura neuronal que representa una distribución como un conjunto ponderado de átomos fijos, adaptada a problemas de acción continua con retorno estocástico.

📖
términos

Riesgo Distributional en Continuo

Medida que cuantifica la incertidumbre en las distribuciones de retorno de los espacios de acción continuos, crucial para la evaluación de políticas robustas.

📖
términos

Política Estocástica Distributional

Estrategia de acción que integra directamente la distribución de retorno en la selección de acciones continuas, optimizando sobre todo el conjunto de la distribución más que sobre la expectativa sola.

📖
términos

Expectativa de Distribución Cuantil

Operador que calcula la expectativa a partir de la representación por cuantiles, preservando las propiedades distributionales en los espacios continuos.

📖
términos

Muestreo por Rechazo Distributional

Método de muestreo que preserva las propiedades distributionales durante la generación de acciones continuas a partir de distribuciones de retorno complejas.

📖
términos

Optimización Distributional Estocástica

Paradigma de optimización que trabaja directamente sobre las distribuciones de retornos más que sobre sus estimaciones puntuales en los espacios continuos.

📖
términos

Aproximación por Núcleos Distribucionales

Técnica que utiliza funciones núcleo para aproximar distribuciones de retorno en espacios de acción continuos de alta dimensión.

📖
términos

Distancia de Wasserstein en RL Continuo

Métrica que mide la disimilaridad entre distribuciones de retorno, particularmente adaptada a problemas de acción continua con geometría compleja.

📖
términos

Muestreo de Importancia Distribucional

Técnica de muestreo ponderado que preserva las características distribucionales durante la estimación de gradientes políticos en continuo.

📖
términos

Actualización Distribucional por Monte-Carlo

Algoritmo que actualiza las distribuciones de retorno utilizando muestras Monte-Carlo en espacios de acción continuos, preservando la forma distribucional.

📖
términos

Reducción de Varianza Distribucional

Conjunto de técnicas que buscan reducir la varianza en las estimaciones distribucionales sin perder información sobre la forma de las distribuciones.

📖
términos

Política Greedy Distribucional

Estrategia que selecciona acciones óptimas según un criterio sobre la distribución completa (ej: cuantil, CVaR) en lugar de solo según la esperanza en continuo.

📖
términos

Ecuación de Bellman Distribucional

Formulación de la ecuación de Bellman que opera sobre distribuciones completas en lugar de valores escalares, fundamental para el RL distribucional continuo.

📖
términos

Crítico Distribucional en Continuo

Red neuronal que estima la distribución completa de retornos para estados-acciones continuos, reemplazando al crítico tradicional de valor escalar.

📖
términos

Sesgo Distribucional en Acción Continua

Fenómeno donde las aproximaciones distribucionales introducen sesgos sistemáticos en la estimación de los retornos en espacios de acción continuos.

📖
términos

Normalización Distribucional Continua

Técnica de normalización que preserva las propiedades distribucionales durante el procesamiento de acciones continuas a diferentes escalas.

📖
términos

Exploración Distribucional Adaptativa

Estrategia de exploración que utiliza la información completa de la distribución de retorno para adaptar el comportamiento exploratorio en acción continua.

🔍

No se encontraron resultados