Agregación de Datos DAgger
DAgger (Agregación de Conjuntos de Datos)
Algoritmo de aprendizaje por imitación que recopila datos de manera iterativa consultando a un experto sobre los estados visitados por la política actual. Este enfoque reduce la brecha entre la distribución de entrenamiento y la distribución de despliegue.
← Volver