Aprendizagem por Reforço para Otimização
Deep Q-Network
Arquitetura de rede neural profunda usada para aproximar a função Q em espaços de estados complexos, combinando aprendizagem profunda e Q-learning.
← Voltar