Deep Deterministic Policy Gradient (DDPG)
Aproximação de Função com Rede Neural
Uso de redes neurais para aproximar funções complexas como políticas ou funções de valor em aprendizado por reforço.
← Voltar