Glosario IA
El diccionario completo de la Inteligencia Artificial
Modelo de Transición Diferenciable
Función matemática que describe la evolución del estado de un sistema continuo, diseñada para ser diferenciable con el fin de permitir la optimización por descenso de gradiente en los algoritmos de aprendizaje por refuerzo.
Ecuaciones Diferenciales Ordinarias (EDO) Estocásticas
Sistema de ecuaciones diferenciales que incorpora un término de ruido aleatorio, utilizado para modelar la dinámica incierta de entornos continuos mientras se mantiene la diferenciabilidad necesaria para el aprendizaje.
Integrador Numérico Diferenciable
Método de cálculo numérico (ej: Euler, Runge-Kutta) cuya implementación es diferenciable, permitiendo propagar los gradientes a través de los pasos de simulación temporal para la optimización de modelos de dinámica.
Red de Neuronas de Función de Base Radial (RBF)
Arquitectura de red neuronal que utiliza funciones de base radial como funciones de activación, especialmente adaptada para la aproximación de funciones continuas y diferenciables para la modelización de dinámicas.
Planificación por Trayectoria Optimizada (TPO)
Método de planificación en el espacio de trayectorias que optimiza directamente una secuencia de acciones utilizando un modelo diferenciable, con actualizaciones basadas en los gradientes de la recompensa esperada.
Modelización por Sistemas Hamiltonianos
Enfoque de modelización de la dinámica continua basado en los principios de conservación de energía de los sistemas hamiltonianos, garantizando propiedades de estabilidad y diferenciabilidad a largo plazo.
Diferenciación Automática a través del Tiempo
Técnica de cálculo de gradientes que propaga la retropropagación a través de los pasos temporales de una simulación continua, esencial para el entrenamiento de modelos de dinámica diferenciables.
Modelo Gaussiano de Proceso Temporal (TGPM)
Extensión de los procesos gaussianos para la modelización de series temporales continuas, ofreciendo una incertidumbre calibrada mientras se mantiene la diferenciabilidad para la optimización en el aprendizaje por refuerzo.
Controlador Neuronal Diferenciable
Red neuronal que implementa una política de control cuyas salidas son funciones diferenciables de los estados de entrada, permitiendo la optimización conjunta con el modelo de dinámica en entornos basados en modelos.
Método de Tiro Múltiple Diferenciable
Algoritmo para resolver problemas de frontera para sistemas continuos, adaptado para ser diferenciable y así permitir la optimización de parámetros en trayectorias de aprendizaje por refuerzo.
Modelo de Espacio de Estados con Funciones Base
Representación de la dinámica continua donde las transiciones de estados se aproximan mediante una combinación lineal de funciones base diferenciables, facilitando la optimización analítica de los parámetros del modelo.
Optimización de Políticas con Modelo Diferenciable (DMPO)
Variante de la optimización de políticas donde los gradientes se calculan a través de un modelo de dinámica diferenciable, combinando las ventajas de los métodos basados en modelos y sin modelo para entornos continuos.
Ecuación de Dinámica Aprendida (LDE)
Formulación matemática donde los parámetros de una ecuación diferencial que describe la dinámica del sistema se aprenden mediante optimización, manteniendo la estructura diferenciable de la ecuación original.
Modelo Híbrido Continuo-Discreto Diferenciable
Arquitectura de modelado que combina componentes continuos diferenciables con eventos discretos, donde las transiciones se suavizan para mantener la diferenciabilidad global del sistema.
Predicción de Estado por Integración Diferenciable
Proceso de predicción de estados futuros utilizando una integración numérica cuya operación es ella misma diferenciable, permitiendo calcular los gradientes de la predicción respecto a los parámetros del modelo.
Red Neuronal Informada Físicamente (PINN)
Arquitectura neuronal que integra ecuaciones diferenciales de la física en su función de pérdida, garantizando que el modelo aprendido respete las leyes de conservación permaneciendo diferenciable.
Método de Colocación Diferenciable
Técnica de resolución de problemas de optimización con restricciones para sistemas continuos, donde las restricciones de colocación se formulan como funciones diferenciables para el entrenamiento de políticas.
Modelo de Transición por Ecuación de Navier-Stokes
Uso de las ecuaciones de Navier-Stokes, hechas diferenciables mediante discretización apropiada, para modelar la dinámica de fluidos en entornos de aprendizaje por refuerzo continuos.
Optimización por Lagrangiano Aumentado Diferenciable
Método de optimización con restricciones donde la función del lagrangiano aumentado es diferenciable con respecto a las variables de estado y de control, permitiendo su uso en bucles de aprendizaje por refuerzo.