Cuantificación y Compresión
Factorización de Matrices de Bajo Rango
Técnica de compresión que descompone una matriz grande de pesos en dos o más matrices más pequeñas. Reduce el número de parámetros y las operaciones de multiplicación matricial, acelerando así las capas densas y convolucionales.
← Volver