Aprendizaje Temporal Diferencial
Bootstrapping TD
Técnica donde las estimaciones de valor actuales se actualizan usando otras estimaciones de valor, permitiendo un aprendizaje en línea sin esperar a los resultados finales.
← Volver