Quantification
LLM.int8()
Méthode spécifique de quantification 8-bit pour grands modèles de langage, combinant décomposition matricielle et quantification hybride.
← RetourMéthode spécifique de quantification 8-bit pour grands modèles de langage, combinant décomposition matricielle et quantification hybride.
← Retour