قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
CUDA
هندسة الحوسبة المتوازية وواجهة البرمجة التي أنشأتها NVIDIA، مما يسمح للمطورين باستخدام وحدات معالجة الرسومات للحوسبة العامة عبر امتدادات للغة C/C++.
Tensor Core
وحدات حوسبة متخصصة مدمجة في وحدات معالجة الرسومات الحديثة من NVIDIA، مصممة لتسريع عمليات ضرب وإضافة المصفوفات بشكل كبير، وهي أساسية للشبكات العصبية العميقة.
ROCm
منصة حوسبة مفتوحة المصدر لوحدات معالجة الرسومات من AMD، تقدم نظامًا بيئيًا متكاملاً من لغات البرمجة (HIP)، والمكتبات (MIOpen) والأدوات للحوسبة عالية الأداء والذكاء الاصطناعي.
OpenCL
معيار مفتوح لكتابة البرامج التي تعمل على منصات متباينة، تشمل وحدات المعالجة المركزية، ووحدات معالجة الرسومات ومعالجات أخرى، من خلال تعريف لغة تعتمد على C99 وواجهات برمجة التطبيقات لإدارة الأجهزة.
cuDNN
مكتبة معجلة بوحدة معالجة الرسومات للدوال الأساسية للشبكات العصبية العميقة، طورتها NVIDIA، توفر تطبيقات محسنة للغاية لعمليات الالتواء، والتجميع، والتطبيع.
Memory Bandwidth
أقصى معدل نقل للبيانات بين وحدة معالجة الرسومات وذاكرتها (VRAM)، مقاسًا بالغيغابايت في الثانية، وهو عامل حاسم لأداء الحوسبة المكثفة وتدريب نماذج الذكاء الاصطناعي الكبيرة.
Kernel
الوظيفة الرئيسية المنفذة على وحدة معالجة الرسومات في برنامج الحوسبة المتوازية، تُطلق على شبكة من الخيوط ومصممة لمعالجة جزء محدد من البيانات بشكل متزامن.
Warp
مجموعة من 32 خيطًا تُنفذ في وضع SIMT (تعليمة واحدة، خيوط متعددة) على وحدات معالجة الرسومات من NVIDIA، تشارك نفس تدفق التعليمات وتشكل وحدة الجدولة الأساسية للتنفيذ المتوازي.
معالج البث المتعدد (SM)
وحدة الحساب الأساسية على بطاقة NVIDIA GPU، تحتوي على أنوية ووحدات ذاكرة مشتركة وجدولات، قادرة على تنفيذ عدة كتل من الخيوط بشكل متزامن وإدارة تنفيذها.
الذاكرة المشتركة
مساحة ذاكرة سريعة ومنخفضة الكمون، مشتركة بين الخيوط في نفس الكتلة على GPU، تتيح التعاون وتقليل الوصول إلى الذاكرة العالمية الأبطأ بكثير.
الذاكرة الموحدة
تقنية إدارة الذاكرة التي تخلق مساحة عنونة موحدة بين CPU وGPU، تلغي الحاجة إلى نسخ البيانات الصريحة وتبسط تطوير التطبيقات غير المتجانسة.
NVLink
تقنية اتصال عالية النطاق الترددي طورتها NVIDIA، تتيح اتصالاً مباشراً وسريعاً بين عدة وحدات معالجة رسومية، متفوقة على حدود ناقل PCIe للحوسبة الموزعة.
FP16 (الدقة النصفية)
تنسيق رقم الفاصلة العائمة على 16 بت، يُستخدم لتسريع الحسابات وتقليل البصمة الذاكرة في الشبكات العصبية، على حساب فقدان طفيف في الدقة غالباً ما يكون مقبولاً.
رسوم CUDA
تقنية تتيح التقاط تسلسل كامل من عمليات CUDA في رسم بياني، ثم إعادة تنفيذه بأقل حمل زائد، مما يقلل تكاليف إطلاق النواة لأحمال العمل المتكررة.
HIP
واجهة برمجة التطبيقات ولغة تجميع طورتها AMD، مصممة كبديل محمول لـ CUDA، تتيح هجرة كود CUDA بسهولة أكبر إلى وحدات معالجة الرسوم AMD.
MIOpen
مكتبة تحسين للشبكات العصبية العميقة على منصة ROCm من AMD، توفر تنفيذات عالية الأداء لطبقات الالتواء والتجميع والتطبيع.
قدرة الحوسبة
رقم إصدار يصف خصائص ووظائف وحدة معالجة الرسومات من NVIDIA، بما في ذلك عدد النوى، والهندسة المعمارية، والتعليمات المدعومة، وقدرات الحوسبة، وهو أمر أساسي لتوافق البرامج.
الوصول المدمج للذاكرة
تحسين الوصول إلى الذاكرة حيث تصل الخيوط المتجاورة في مجموعة الوارب إلى مواقع ذاكرة متجاورة، مما يسمح بدمج هذه الطلبات في معاملة ذاكرة واحدة واسعة وفعالة.