Aprendizaje por Predicción de Trayectorias
Buffer de experiencia imaginaria
Estructura de datos que almacena las trayectorias simuladas generadas por el modelo para el entrenamiento, complementando la experiencia real recopilada en el entorno.
← Volver