Métodos Estocásticos de Segunda Ordem
Shampoo Optimizer
Otimizador de segunda ordem que pré-condiciona os gradientes usando aproximações de matrizes de Kronecker para os tensores de peso, adaptativo à estrutura dos parâmetros do modelo.
← Voltar