Edge MLOps
Cuantización de Modelo
Técnica de reducción de la precisión numérica de los pesos y activaciones de un modelo ML (típicamente de 32 bits a 8 bits) para optimizar su tamaño y tiempo de inferencia en dispositivos edge.
← Volver