قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
TF32 (تنسورفلوت-32)
تنسيق هجين خاص بشركة NVIDIA مكون من 19 بت يجمع بين 8 بت للأس من FP16 و 10 بت للمانتيسة من FP32، مُحسّن لعمليات المصفوفات على نوى Tensor في وحدات معالجة الرسوميات Ampere و Hopper.
النطاق الديناميكي
نطاق القيم القابلة للتمثيل بين أصغر رقم مُطبع وأكبر رقم عائم، وهو أمر حاسم في اختيار الدقة لأن FP16 له نطاق ديناميكي محدود (65504) مقارنة بـ FP32 (3.4×10³⁸).
التكميم بعد التدريب (PTQ)
عملية تحويل نموذج مُدرب مسبقًا بدقة كاملة إلى دقة مخفضة (FP16, INT8, INT4) بدون إعادة تدريب، باستخدام تقنيات المعايرة لتحديد عوامل القياس والانحياز المثلى.
الضرب والإضافة المدمجة (FMA)
عملية عتادية تجمع بين الضرب والجمع في تعليمة واحدة (a×b+c) مع تقريب واحد، وهي أساسية لتسريع حسابات المصفوفات بدقة مختلطة وتقليل أخطاء التقريب التراكمية.
الاستقرار العددي
خاصية الخوارزمية للحفاظ على دقة الحسابات في مواجهة أخطاء التقريب والتجاوز/النقصان، وهي حرجة بشكل خاص في الدقة المختلطة حيث يمكن أن يؤدي النطاق الديناميكي المحدود إلى زعزعة استقرار بعض الحسابات.
تكميم INT8
تقنية لضغط الأوزان والتنشيطات العصبية إلى 8 بتات صحيحة موقعة (-128 إلى 127) مع عوامل قياس ونقاط صفرية، مما يوفر تقليلًا في الذاكرة يصل إلى 4 أضعاف وتسريعًا كبيرًا على الأجهزة المتوافقة.
عمليات المصفوفات الدقيقة
مجموعة من العمليات الخطية (GEMM، الالتفاف) حيث تستخدم أجزاء مختلفة من الحساب دقات مختلفة - عادةً التجميع في FP32 مع الضرب في FP16/BF16 لتحسين الإنتاجية على وحدات معالجة الرسوميات الحديثة.