قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
دمج الذاكرة
تقنية تحسين على معالج الرسوميات حيث يتم تجميع الوصول المتجاور للذاكرة من الخيوط في معاملات فردية، مما يقلل عرض نطاق الذاكرة ويزيد الإنتاجية.
تجميع الذاكرة المخبأة
إستراتيجية تقسيم البيانات إلى كتل بحجم مناسب للذاكرة المخبأة لتعظيم إعادة استخدام البيانات المحلية وتقليل حالات فشل الذاكرة المخبأة.
تخصيص واعٍ لـ NUMA
تخصيص ذاكرة يأخذ في الاعتبار بنية الذاكرة غير الموحدة للوصول لوضع البيانات بالقرب من النوى التي تستخدمها بشكل متكرر، مما يقلل زمن الوصول.
تجمع الذاكرة
التخصيص المسبق لكتلة ذاكرة كبيرة مقسمة إلى كائنات قابلة لإعادة الاستخدام، مما يلغي عبء التخصيص/إلغاء التخصيص الديناميكي المتكرر.
تحسين النسخ الصفري
تقنية تسمح للعمليات بالوصول مباشرة إلى البيانات دون نسخ وسيط بين مساحات الذاكرة، مما يقلل استهلاك وحدة المعالجة المركزية وعرض النطاق.
تبليط السجلات
استخدام سجلات المعالج لتخزين مربعات البيانات مؤقتًا، مما يقلل الوصول إلى الذاكرة الهرمية الأبطأ.
تعليمات الجلب المسبق
تعليمات خاصة تحمل البيانات مسبقًا في الذاكرة المخبأة قبل استخدامها الفعلي، مما يخفي زمن الوصول للذاكرة عن طريق تداخل الحساب/الوصول.
تقليل بصمة الذاكرة
مجموعة من التقنيات (التكميم، التقليم، الضغط) تهدف إلى تقليل حجم ذاكرة نماذج الذكاء الاصطناعي دون تدهور كبير في الأداء.
استخدام الذاكرة المشتركة
تحسين استخدام ذاكرة GPU المشتركة كمساحة بيانات سريعة وقابلة لإعادة الاستخدام بين خيوط نفس الكتلة.
تشبع نطاق الذاكرة
الحالة التي تتجاوز فيها طلبات الوصول إلى الذاكرة سعة ناقل الذاكرة، مما يصبح الاختناق الرئيسي لأداء الحساب.
هجرة الصفحات
نقل ديناميكي لصفحات الذاكرة بين عقد NUMA بناءً على أنماط الوصول لتحسين محلية البيانات.
جدولة واعية بالذاكرة
جدولة المهام مع مراعاة قيود وأنماط الوصول إلى الذاكرة لتقليل التزاحم وتعظيم التوازي.
خوارزميات غير مبالية بالذاكرة المخبأة
خوارزميات مصممة لأداء فعال على أي تسلسل هرمي للذاكرة المخبأة دون الحاجة إلى معلمات محددة لأحجام الذاكرة المخبأة.
تحسين التسلسل الهرمي للذاكرة
استراتيجية شاملة لوضع البيانات وفقًا لتردد الوصول والأهمية الزمنية عبر مستويات التسلسل الهرمي للذاكرة.
تخطيط ذاكرة Tensor Core
تنظيم محدد للموترات في الذاكرة لتعظيم كفاءة العمليات المصفوفية على Tensor Cores من NVIDIA.
تباعد الوصول إلى الذاكرة
ظاهرة تصل فيها خيوط warp في GPU إلى عناوين ذاكرة غير متجاورة، مما يقلل الأداء من خلال تسلسل الوصول.
دمج ذاكرة النطاق العالي (HBM)
هندسة ذاكرة ثلاثية الأبعاد مكدسة توفر نطاقًا تردديًا أعلى لأحمال عمل الذكاء الاصطناعي المكثفة، مع تحسين محدد لأنماط الوصول.
تحسين الإدخال/الإخراج المعين للذاكرة
تقنية تسمح للأجهزة الطرفية بالوصول المباشر إلى ذاكرة النظام، مما يقلل من عمليات النسخ والحمل الزائد لوحدة المعالجة المركزية في مسارات الذكاء الاصطناعي.