Edge MLOps
Model Quantization
Technique de réduction de la précision numérique des poids et activations d'un modèle ML (typiquement de 32 bits à 8 bits) pour optimiser sa taille et son temps d'inférence sur dispositifs edge.
← 返回