Deep Deterministic Policy Gradient (DDPG)
Espaço de Ação Contínuo
Ambiente onde as ações podem assumir qualquer valor em um intervalo contínuo, necessitando algoritmos adaptados ao contrário das ações discretas.
← Voltar