Aprendizaje por Predicción de Trayectorias
Exploración por simulación
Estrategia de exploración donde el agente descubre nuevas políticas simulando masivamente escenarios en su modelo antes de probar las más prometedoras en realidad.
← Volver