Otimização de Modelos
Batch Normalization Folding
Otimização aplicada após o treinamento que integra os parâmetros da camada de normalização em lote (média e variância) nos pesos e vieses da camada convolucional ou linear anterior, eliminando assim a necessidade de calcular a normalização na inferência e reduzindo a latência.
← Voltar