تحسين نوى الموتر
ضرب-تجميع مصفوفة Warp (WMMA)
واجهة برمجة تطبيقات CUDA تسمح لمجموعات Warp المكونة من 32 خيطًا (thread) بإجراء عمليات ضرب-تجميع المصفوفات بكفاءة مباشرة على نوى Tensor مع الوصول إلى السجلات المجزأة.
← رجوع