قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
K-means الموزع
خوارزمية تجميع (clustering) تقوم بموازاة خوارزمية K-means الكلاسيكية عبر عدة عقد حوسبة، باستخدام أطر عمل مثل MapReduce أو Spark لمعالجة مجموعات البيانات الضخمة بكفاءة.
التجميع الهرمي الموزع
نهج تجميع هرمي مُكيّف للبيانات الضخمة يقسم الحساب إلى خطوات متوازية، باستخدام تقنيات تقليل البيانات والدمج الذكي للحفاظ على الاتساق الهرمي.
DBSCAN المتوازي
تطبيق متوازي لخوارزمية DBSCAN (التجميع المكاني للتطبيقات القائم على الكثافة مع الضوضاء) مُحسّن للمعالجة الموزعة للبيانات المكانية واسعة النطاق مع الحفاظ على الكثافة المحلية.
Mean Shift الموزع
نسخة موزعة من خوارزمية Mean Shift التي تحسب أنماط الكثافة بطريقة متوازية، ومناسبة للتجميع غير البارامتري على مجموعات بيانات ضخمة عالية الأبعاد.
التجميع الطيفي الموزع
خوارزمية تجميع طيفي مُحسّنة للبيانات الضخمة تقوم بتحليل حساب القيم الذاتية إلى مهام متوازية، باستخدام تقنيات تقريب المصفوفات لإدارة الرسوم البيانية الكبيرة.
BIRCH
Balanced Iterative Reducing and Clustering using Hierarchies (تقليل وتجميع تكراري متوازن باستخدام التسلسلات الهرمية): خوارزمية هرمية تزايدية مصممة خصيصًا لقواعد البيانات الكبيرة، تستخدم بنية شجرة CF (شجرة ميزة التجميع) لتجميع فعال في تمريرة واحدة.
CURE
Clustering Using REpresentatives (التجميع باستخدام الممثلين): خوارزمية هرمية تستخدم مجموعة من النقاط التمثيلية لكل مجموعة لالتقاط الشكل والحجم، مما يسمح بتجميع قابل للتطوير ومقاوم للقيم الشاذة على مجموعات البيانات الكبيرة.
CLARANS
Clustering Large Applications based upon RANdomized Search (تجميع التطبيقات الكبيرة بناءً على البحث العشوائي): خوارزمية تجميع قائمة على البحث العشوائي مُحسّنة للتطبيقات الكبيرة، وتقدم حلاً وسطًا بين K-means و PAM (التقسيم حول الوسائط).
تجميع K-means المتدفق
نسخة من K-means مصممة لتدفقات البيانات المستمرة التي تقوم بتحديث المراكز بشكل تدريجي، مما يسمح بالتجميع في الوقت الفعلي للبيانات الضخمة التي تصل بالتسلسل.
تجميع MapReduce
نموذج تجميع يستخدم إطار عمل MapReduce لتوزيع الحسابات على مجموعات من الأجهزة، ويقسم البيانات إلى أجزاء لمعالجة متوازية فعالة على نطاق البيتابايت.
تجميع Spark MLlib
مجموعة من خوارزميات التجميع المطبقة في مكتبة MLlib الخاصة بـ Apache Spark، والمحسّنة للمعالجة في الذاكرة والتوازي على المجموعات الموزعة للبيانات الضخمة.
نموذج الخليط الغاوسي الموزع
نموذج خليط غاوسي موزع يقوم بتقدير المعلمات عبر خوارزمية EM (التعظيم المتوقع) المتوازية، وهو مناسب للتجميع الاحتمالي على البيانات الضخمة.
التجميع الهرمي القابل للتطوير
عائلة من الخوارزميات الهرمية المحسّنة لقابلية التوسع، باستخدام تقنيات أخذ العينات، وتلخيص البيانات، والحساب الموزع لإدارة ملايين النقاط بكفاءة.
التجميع الطيفي المتوازي
تطبيق عالي الأداء للتجميع الطيفي الذي يوازي خطوات حساب مصفوفة التشابه، وتحليل القيم الذاتية، وتعيين المجموعات للرسوم البيانية الضخمة.
التجميع الموزع القائم على الكثافة
فئة من الخوارزميات القائمة على الكثافة والمكيفة للمعالجة الموزعة، باستخدام تقنيات التقسيم المكاني ودمج النتائج المحلية لتحديد مجموعات ذات شكل عشوائي في البيانات الضخمة.
تحسين تجميع البيانات الضخمة
مجموعة من تقنيات التحسين المطبقة على خوارزميات التجميع للبيانات الضخمة، بما في ذلك الفهرسة الموزعة، وتقليل الأبعاد، وتوازي GPU لتسريع الحسابات.
تجميع الجيران الأقرب التقريبي
تقنية تجميع تستخدم خوارزميات البحث عن الجيران الأقرب التقريبي لتقليل التعقيد الحسابي، وهي ضرورية للتجميع واسع النطاق في الأبعاد العالية.