AutoML Embebido y Edge
Cuantificación de modelo
Técnica de optimización que reduce la precisión numérica de los pesos y activaciones de una red neuronal (típicamente de 32 bits a 8 bits o menos) para disminuir el tamaño del modelo y acelerar la inferencia en hardware restringido.
← Volver