قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
GPU (Graphics Processing Unit)
وحدة معالجة الرسومات، معالج تم تصميمه في الأصل لعرض الرسومات، ولكن بنيته المتوازية تجعله فعالاً للغاية في تسريع العمليات الحسابية للمصفوفات في خوارزميات التعلم العميق.
TPU (Tensor Processing Unit)
وحدة معالجة الموتر، دائرة متكاملة خاصة (ASIC) طورتها جوجل، محسّنة لتسريع عمليات ضرب المصفوفات وتفعيلات الشبكات العصبية، خاصة مع إطار العمل TensorFlow.
Spot Instances
الحالات الفورية، مثيلات حساب سحابية منخفضة التكلفة، متاحة بأسعار متغيرة ويمكن مقاطعتها من قبل المزود، غالباً ما تستخدم لمهام تدريب التعلم الآلي التي تتسامح مع المقاطعات.
Auto-scaling
التحجيم التلقائي، قدرة البنية التحتية على تعديل عدد موارد الحوسبة (الخوادم، القرون) ديناميكياً بناءً على عبء العمل، لتحسين التكاليف وأداء خدمات الاستدلال.
Model Serving Framework
إطار خدمة النماذج، أداة متخصصة (مثل: TensorFlow Serving, TorchServe, Triton Inference Server) مصممة لنشر وخدمة وإدارة نماذج التعلم الآلي بفعالية في الإنتاج، مع إدارة التحديثات والتحميل الديناميكي.
Hybrid Cloud
السحابة الهجينة، بنية تجمع بين موارد الحوسبة السحابية العامة والخاصة (محلية)، مما يسمح للشركات بمرونة أحمال عمل التعلم الآلي وفقاً لمتطلبات الأمان والتكلفة والأداء.
ML Pipeline Orchestrator
منسق خطوط أنابيب التعلم الآلي، نظام (مثل: Kubeflow Pipelines, Airflow, Prefect) يحدد وينفذ ويراقب وينسق تدفقات عمل التعلم الآلي المعقدة، من إعداد البيانات إلى التدريب والنشر.
Resource Quotas
حصص الموارد، آلية لإدارة الموارد السحابية/المحلية تحدد كمية المعالج المركزي ووحدة معالجة الرسومات والذاكرة أو التخزين التي يمكن للمستخدم أو المشروع أو مساحة الاسم استهلاكها، ضرورية لإدارة التكاليات والإنصاف.
البدء البارد
الاستجابة الأولية الملاحظة عند الطلب الأول لخدمة استنتاج بلا خوادم أو نموذج تم تحميله حديثًا، بسبب وقت توفير الموارد وتحميل النموذج في الذاكرة.