Deep RL Basado en Modelo
Optimización de Trayectoria
Optimización directa de secuencias de estados-acciones utilizando el gradiente del modelo para encontrar trayectorias óptimas, particularmente efectivo para sistemas continuos.
← Volver