Descida de Gradiente Estocástica (SGD)
Gradiente Acelerado de Nesterov
Variante aprimorada do momentum que calcula o gradiente em uma posição antecipada em vez da posição atual, oferecendo uma convergência teoricamente mais rápida.
← Voltar