Glosario IA
El diccionario completo de la Inteligencia Artificial
Off-Policy Learning
Método de aprendizaje donde el agente aprende una política óptima mientras sigue otra política de comportamiento, permitiendo una mejor exploración.
Target Networks
Redes neuronales duplicadas con pesos actualizados lentamente para estabilizar el aprendizaje proporcionando objetivos más consistentes.
Ornstein-Uhlenbeck Process
Proceso estocástico utilizado para generar ruido correlacionado temporalmente en las acciones, favoreciendo una exploración eficiente en espacios continuos.
Continuous Action Space
Entorno donde las acciones pueden tomar cualquier valor en un intervalo continuo, requiriendo algoritmos adaptados a diferencia de las acciones discretas.
Neural Network Function Approximation
Uso de redes neuronales para aproximar funciones complejas como políticas o funciones de valor en aprendizaje por refuerzo.
Soft Update
Método de actualización progresiva de redes objetivo utilizando un coeficiente tau (τ) para mezclar lentamente los pesos de las redes principales y objetivo.
Actor Network
Red neuronal que aprende a mapear directamente los estados a las acciones óptimas en un espacio de acción continuo.
Deterministic Policy
Política que asocia una acción específica a cada estado, a diferencia de las políticas estocásticas que devuelven distribuciones de probabilidades.
Ruido de Acción
Ruido añadido a las acciones producidas por el actor para fomentar la exploración del espacio de acción continuo durante el entrenamiento.