التكميم والضغط
التكميم بعد التدريب (PTQ)
تقنية لتخفيض الدقة تُطبق على نموذج مدرب مسبقاً دون الحاجة إلى إعادة تدريب كاملة. تقوم بتحويل الأوزان والتفعيلات عالية الدقة (مثل FP32) إلى تمثيلات ذات دقة أقل (مثل INT8) لتحسين الاستدلال.
← رجوع