Glosario IA
El diccionario completo de la Inteligencia Artificial
Bootstrap en RL
Técnica de remuestreo utilizada en aprendizaje por refuerzo para estimar la incertidumbre de las funciones de valor creando múltiples estimaciones a partir de una misma muestra de datos.
Distribución de valor Bootstrap
Representación probabilística de la función de valor obtenida mediante la agregación de múltiples estimaciones bootstrap, lo que permite cuantificar la incertidumbre en las predicciones de valor.
Bootstrap ponderado
Técnica que asigna pesos a las muestras bootstrap basándose en su relevancia o actualidad para dar más importancia a las experiencias más informativas en la estimación de valor.
Q-learning con Bootstrap
Extensión del Q-learning clásico que utiliza múltiples cabezas de valor Q entrenadas en diferentes muestras bootstrap para capturar la incertidumbre y mejorar la exploración.
C51 (Categórico 51)
Algoritmo distribucional que discretiza la distribución de los retornos en 51 átomos de probabilidad, utilizando técnicas bootstrap para estimar la incertidumbre sobre esta representación.
IQN (Redes Cuantílicas Implícitas)
Arquitectura de red que aprende directamente la distribución cuantílica de los retornos, integrando mecanismos bootstrap para cuantificar la incertidumbre de las predicciones cuantílicas.
QR-DQN (DQN de Regresión Cuantílica)
Variante del DQN que utiliza la regresión cuantílica sobre muestras bootstrap para aprender la distribución completa de los valores de acción con cuantificación de incertidumbre.
Redes de cabeza Bootstrap
Arquitectura que comprende múltiples cabezas de salida independientes entrenadas en diferentes muestras bootstrap para capturar la incertidumbre en las predicciones de valor.
Exploración basada en la incertidumbre
Estrategia de exploración que utiliza estimaciones bootstrap para cuantificar la incertidumbre y guiar al agente hacia los estados menos conocidos del entorno.
Conjuntos Bootstrap
Método que entrena múltiples modelos en diferentes muestras bootstrap para formar un conjunto predictivo que capture la variabilidad y la incertidumbre del proceso de aprendizaje.
Dropout como aproximación Bootstrap
Técnica que utiliza dropout durante la inferencia como una aproximación eficiente del bootstrap para estimar rápidamente la incertidumbre sin entrenar múltiples modelos.
Intervalos creíbles
Intervalos estadísticos derivados de las distribuciones bootstrap que cuantifican la incertidumbre sobre las estimaciones de valor con una probabilidad de confianza especificada.
Varianza Bootstrap
Métrica que cuantifica la dispersión de las estimaciones bootstrap entre sí, sirviendo como un indicador directo de la incertidumbre epistémica en las predicciones de valor.
Sesgo Bootstrap
Desviación sistemática potencialmente introducida por los métodos bootstrap, que requiere técnicas de corrección como el doble bootstrap para obtener estimaciones insesgadas.
Bootstrap secuencial
Variante adaptada a los datos temporales del RL que preserva la estructura de dependencia secuencial durante el remuestreo para evitar la subestimación de la incertidumbre.