Otimização de Aprendizagem Online
AdamW
Uma modificação do Adam que separa a decaimento de peso da atualização adaptativa, melhorando a generalização e a estabilidade em contextos de aprendizado contínuo.
← Voltar