Factorización del Valor
Arquitectura Dueling
Estructura de red neuronal con dos flujos distintos: uno para estimar V(s) y otro para estimar A(s,a), combinados posteriormente para obtener Q(s,a).
← Volver