قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
HDFS
نظام الملفات الموزع الأساسي لهدوپ مصمم لتخزين بيتابايت من البيانات على مجموعات من الأجهزة القياسية مع النسخ المتماثل التلقائي وتحمل الأعطال.
MapReduce
نموذج برمجة وتنفيذ للمعالجة الموزعة لمجموعات البيانات الكبيرة على المجموعات، حيث يقسم المهام إلى مراحل التخطيط والاختزال.
YARN
مدير موارد هدوپ الذي ينظم تخصيص موارد وحدة المعالجة المركزية والذاكرة للتطبيقات مع إدارة دورة حياة المهام في المجموعة.
HBase
قاعدة بيانات NoSQL موزعة موجهة للأعمدة وغير علنية مبنية على HDFS، تتيح الوصول في الوقت الفعلي للبيانات الضخمة مع اتساق قوي.
Hive
بنية تحتية لمستودع البيانات على هدوپ تتيح الاستعلام عن مجموعات البيانات الكبيرة بلغة مشابهة لـ SQL (HiveQL) مع استخدام MapReduce للتنفيذ.
Pig
منصة عالية المستوى لتحليل البيانات تستخدم لغة Pig Latin للتعبير عن برامج تحويل البيانات المعقدة التي يتم تنفيذها على هدوپ.
Spark
محرك معالجة موحد فائق السرعة للبيانات الضخمة، يقدم واجهات برمجة في Scala وJava وPython وR مع دعم لـ SQL والبث المباشر وتعلم الآلة ومعالجة الرسوم البيانية.
ZooKeeper
خدمة تنسيق موزع مركزية للحفاظ على معلومات التكوين والتسمية والمزامنة الموزعة وإدارة مجموعات الخدمات.
فلوم
خدمة موزعة وموثوقة ومتاحة لجمع وتجميع ونقل كميات كبيرة من بيانات البث المباشر إلى HDFS مع بنية تعتمد على الوكلاء.
سكووب
أداة مصممة لنقل البيانات بكميات كبيرة بكفاءة بين Hadoop وقواعد البيانات المنظمة مثل قواعد البيانات العلائقية.
أوزي
نظام سير عمل ومنسق لإدارة وتنفيذ خطوط معالجة بيانات Hadoop المعقدة مع تبعيات زمنية وشرطية.
ماهاوت
مكتبة خوارزميات تعلم الآلة وتنقيب البيانات الموزعة المنفذة على Hadoop MapReduce لمعالجة مجموعات البيانات الكبيرة.
أمباري
منصة إدارة ومراقبة عناقيد Hadoop تقدم واجهة ويب لتوفير وإدارة ومراقبة النظام البيئي Hadoop الكامل.
إتش كاتالوج
خدمة إدارة البيانات الوصفية والجدول للنظام البيئي Hadoop، توفر رؤية موحدة للبيانات لأدوات مثل Pig وHive وMapReduce.
أفرو
نظام تسلسل بيانات بمخطط قابل للتطور، يوفر تنسيقات بيانات مضغوطة وسريعة للتبادل بين خدمات Hadoop.
باركيه
تنسيق ملف عمودي محسن لأداء الاستعلامات التحليلية على Hadoop، مع ضغط فعال ودعم للأنواع المعقدة.
إمبالا
محرك استعلامات SQL متوازي بشكل كبير لهدووب، يقدم أداء استعلامات تفاعلية ذات زمن انتقال منخفض على البيانات المخزنة في HDFS وHBase.
تيز
إطار عمل تنفيذ بيانات غير دوري معمم لهدووب YARN، يحسن أداء المعالجات المعقدة من خلال إزالة مراحل MapReduce غير الضرورية.
ستورم
نظام موزع لمعالجة التدفق في الوقت الفعلي لهدووب، قادر على معالجة كميات هائلة من البيانات بأزمنة انتقال في حدود الميلي ثانية.
كافكا
منصة مراسلة موزعة عالية الأداء والتوفر لجمع ومعالجة تدفقات البيانات في الوقت الفعلي في النظام البياضي لهدووب.