Quantification par Regroupement
Quantification par Regroupement
Technique de compression de modèles qui regroupe les poids similaires en clusters pour réduire la mémoire tout en préservant les performances. Cette approche permet une représentation compacte des poids en utilisant un nombre limité de centroïdes représentatifs.
← Retour