Factorisation de la Valeur
Architecture dueling
Structure de réseau de neurones avec deux flux distincts : un pour estimer V(s) et un autre pour estimer A(s,a), recombinés pour obtenir Q(s,a).
← Tillbaka