Descida de Gradiente Estocástica (SGD)
Learning Rate Schedule
Estratégia que ajusta dinamicamente a taxa de aprendizado (learning rate) durante o treinamento para melhorar a convergência, incluindo abordagens como step decay, exponential decay e cosine annealing.
← Voltar