Aprendizagem por Dyna-Q
Dyna-Q
Algoritmo híbrido de aprendizagem por reforço que combina aprendizagem direta a partir da experiência real e planeamento usando um modelo aprendido para gerar experiências simuladas adicionais.
← Voltar