Aprendizagem por Predição de Trajetórias
Buffer de experiência imaginária
Estrutura de dados que armazena as trajetórias simuladas geradas pelo modelo para treinamento, complementando a experiência real coletada no ambiente.
← Voltar