Cuantización Mixta
Cuantización por Tensor
Método que aplica un único conjunto de parámetros de cuantización a todo un tensor, garantizando una coherencia de escala para todos los valores. Este enfoque simplifica la implementación por hardware pero puede reducir la precisión para distribuciones amplias.
← Volver