قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
MapReduce
نموذج برمجة متوازية لمعالجة مجموعات البيانات الكبيرة على مجموعات الأجهزة، حيث يقسم المعالجة إلى مرحلتين رئيسيتين: Map للتصفية والتحويل، وReduce لتجميع النتائج.
Lambda Architecture
هندسة معالجة البيانات التي تجمع بين مسار الدُفعات للتحليل الكامل ومسار السرعة للنتائج في الوقت الفعلي، مع طبقة خدمة موحدة لدمج العرضين.
Kappa Architecture
تبسيط لهندسة Lambda باستخدام خط أنابيب معالجة تدفق البيانات فقط، حيث تتم معالجة البيانات في الوقت الفعلي ويتم تلبية الاستعلامات التاريخية من خلال إعادة تشغيل الأحداث.
Batch Processing
نمط معالجة حيث يتم جمع البيانات ومعالجتها على شكل دفعات في فترات زمنية محددة مسبقاً، مُحسَّن للإنتاجية بدلاً من زمن الاستجابة، نموذجي لتحليلات ETL التقليدية.
Stream Processing
معالجة مستمرة للبيانات المتحركة أثناء توليدها، مما يتيح تحليلات في الوقت الفعلي بأقل زمن استجابة بين الالتقاط والمعالجة.
Distributed File System
نظام ملفات يخزن البيانات على عدة خوادم مع ظهوره كنظام واحد للمستخدمين، مما يضمن التكرار وتحمل الأعطال لتحقيق الموثوقية.
HDFS
نظام ملفات Hadoop الموزع، نظام ملفات موزع مصمم لتخزين بيتابايت من البيانات على أجهزة قياسية مع تحمل عالي للأعطال من خلال تكرار الكتل.
YARN
مفاوض الموارد آخر، مدير موارد Hadoop الذي يفصل بين معالجة البيانات وإدارة الموارد، مما يسمح بتنفيذ إطارات عمل متعددة على نفس المجموعة.
RDD
مجموعة البيانات الموزعة المرنة، البنية الأساسية للبيانات في Spark التي تمثل مجموعة غير قابلة للتغيير ومقسمة من الكائنات التي يمكن حسابها بالتوازي مع تحمل تلقائي للأعطال.
Data Locality
مبدأ الحوسبة الموزعة حيث يتم تنفيذ المهام على العقد التي تحتوي على البيانات اللازمة، مما يقلل من نقل الشبكة ويحسن الأداء بشكل كبير.
Speculative Execution
آلية تحمل الأعطاء التي تطلق نسخًا من المهام البطيئة على عقد أخرى، باستخدام النتيجة الأولى المكتملة لتقليل تأثير العقد المعيبة أو المثقلة بالأعباء.
DAG
الرسم البياني الموجه غير الدوري، تمثيل لتدفق العمل في Spark حيث يتم تنظيم التحولات في رسم بياني موجه بدون دورات، مما يحسن التنفيذ المتوازي للمراحل.
Fault Tolerance
قدرة النظام الموزع على الاستمرار في العمل بشكل صحيح في حالة فشل المكونات، عادةً من خلال التكرار والنسخ المتماثل وآليات الاستعادة التلقائية.
Consistency Model
عقد يحدد ضمانات اتساق البيانات في نظام موزع، يتراوح من الاتساق القوي إلى الاتساق النهائي وفقًا للاحتياجات التطبيقية.
Combiner
وظيفة تحسين MapReduce تعمل محليًا على كل مقسم لتقليل حجم البيانات المنقولة أثناء الخلط، تطبيق تجميع مسبق قبل مرحلة التخفيض.