Gradiente Acelerado de Nesterov
Mecanismo Lookahead
Técnica de otimização que mantém dois conjuntos de pesos: pesos rápidos atualizados frequentemente e pesos lentos que seguem a média dos pesos rápidos para melhorar a generalização.
← Voltar