Apprentissage par Renforcement pour l'Optimisation
Deep Q-Network
Architecture de réseau neuronal profond utilisée pour approximer la fonction Q dans des espaces d'états complexes, combinant apprentissage profond et Q-learning.
← Volver