Post-Training Quantization
Integer-only Inference
Paradigme d'exécution où toutes les opérations du modèle sont effectuées en arithmétique entière, éliminant complètement les conversions en virgule flottante pour une performance maximale.
← Back