AutoML Embarcado e Edge
Quantização de modelo
Técnica de otimização que reduz a precisão numérica dos pesos e ativações de uma rede neural (tipicamente de 32-bit para 8-bit ou menos) para diminuir o tamanho do modelo e acelerar a inferência em hardware restrito.
← Voltar