AutoML Embarqué et Edge
Quantification de modèle
Technique d'optimisation qui réduit la précision numérique des poids et activations d'un réseau neuronal (typiquement de 32-bit à 8-bit ou moins) pour diminuer la taille du modèle et accélérer l'inférence sur matériel contraint.
← Retour