الحوسبة بالدقة المختلطة - مسرد الذكاء الاصطناعي

📖

المصطلحات

TF32 (تنسورفلوت-32)

تنسيق هجين خاص بشركة NVIDIA مكون من 19 بت يجمع بين 8 بت للأس من FP16 و 10 بت للمانتيسة من FP32، مُحسّن لعمليات المصفوفات على نوى Tensor في وحدات معالجة الرسوميات Ampere و Hopper.

📖

المصطلحات

النطاق الديناميكي

نطاق القيم القابلة للتمثيل بين أصغر رقم مُطبع وأكبر رقم عائم، وهو أمر حاسم في اختيار الدقة لأن FP16 له نطاق ديناميكي محدود (65504) مقارنة بـ FP32 (3.4×10³⁸).

📖

المصطلحات

التكميم بعد التدريب (PTQ)

عملية تحويل نموذج مُدرب مسبقًا بدقة كاملة إلى دقة مخفضة (FP16, INT8, INT4) بدون إعادة تدريب، باستخدام تقنيات المعايرة لتحديد عوامل القياس والانحياز المثلى.

📖

المصطلحات

الضرب والإضافة المدمجة (FMA)

عملية عتادية تجمع بين الضرب والجمع في تعليمة واحدة (a×b+c) مع تقريب واحد، وهي أساسية لتسريع حسابات المصفوفات بدقة مختلطة وتقليل أخطاء التقريب التراكمية.

📖

المصطلحات

الاستقرار العددي

خاصية الخوارزمية للحفاظ على دقة الحسابات في مواجهة أخطاء التقريب والتجاوز/النقصان، وهي حرجة بشكل خاص في الدقة المختلطة حيث يمكن أن يؤدي النطاق الديناميكي المحدود إلى زعزعة استقرار بعض الحسابات.

📖

المصطلحات

تكميم INT8

تقنية لضغط الأوزان والتنشيطات العصبية إلى 8 بتات صحيحة موقعة (-128 إلى 127) مع عوامل قياس ونقاط صفرية، مما يوفر تقليلًا في الذاكرة يصل إلى 4 أضعاف وتسريعًا كبيرًا على الأجهزة المتوافقة.

📖

المصطلحات

عمليات المصفوفات الدقيقة

مجموعة من العمليات الخطية (GEMM، الالتفاف) حيث تستخدم أجزاء مختلفة من الحساب دقات مختلفة - عادةً التجميع في FP32 مع الضرب في FP16/BF16 لتحسين الإنتاجية على وحدات معالجة الرسوميات الحديثة.

قاموس الذكاء الاصطناعي

TF32 (تنسورفلوت-32)

النطاق الديناميكي

التكميم بعد التدريب (PTQ)

الضرب والإضافة المدمجة (FMA)

الاستقرار العددي

تكميم INT8

عمليات المصفوفات الدقيقة

لم يتم العثور على نتائج