Agregação de Dados DAgger
DAgger (Dataset Aggregation)
Algoritmo de aprendizagem por imitação que coleta iterativamente dados, consultando um especialista sobre os estados visitados pela política atual. Esta abordagem reduz o desvio entre a distribuição de treinamento e a distribuição de implantação.
← Voltar