Edge MLOps
Quantização de Modelo
Técnica de redução da precisão numérica dos pesos e ativações de um modelo ML (tipicamente de 32 bits para 8 bits) para otimizar seu tamanho e tempo de inferência em dispositivos edge.
← Voltar