قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
شجرة CF (شجرة ميزة التجميع)
هيكل بيانات شجري في صميم خوارزمية BIRCH، يخزن الملخصات الإحصائية (ميزات التجميع) في عُقده لتمثيل المجموعات الفرعية بشكل مضغوط.
ميزة التجميع (CF)
ثلاثية (N, LS, SS) تلخص إحصائيًا مجموعة فرعية، حيث N هو عدد النقاط، LS هو المجموع الخطي للنقاط، و SS هو مجموع مربعات النقاط.
عتبة القطر (Threshold)
معلمة في BIRCH تحدد القطر الأقصى لمجموعة فرعية في ورقة شجرة CF، وتتحكم في دقة ملخص التجميع.
عامل التفرع (Branching Factor)
معلمة تحد من عدد الإدخالات (الأبناء) لكل عقدة في شجرة CF، وتؤثر على حجم وشكل الشجرة لتحسين الأداء.
التجميع المصغر (Micro-clustering)
المرحلة الأولية في BIRCH حيث يتم تنظيم نقاط البيانات في مجموعات مصغرة، ممثلة بإدخالات أوراق شجرة CF.
التجميع الكلي (Macro-clustering)
المرحلة النهائية في BIRCH التي تطبق خوارزمية تجميع (مثل K-Means) على المجموعات المصغرة (أوراق شجرة CF) لتوليد المجموعات النهائية.
الملخص التزايدي
قدرة BIRCH على تحديث شجرة CF بنقاط بيانات جديدة دون الحاجة إلى إعادة حساب كامل من البداية، وهو مثالي لتدفقات البيانات.
المسافة التجميعية الإضافية لـ CF (CF Additive Distance)
مقياس مسافة يُستخدم في BIRCH لقياس القرب بين ميزتي تجميع، يمكن حسابه مباشرة من ملخصاتهما الإحصائية دون الوصول إلى النقاط الأصلية.
مدخل الورقة (Leaf Entry)
عنصر في ورقة شجرة CF يمثل مجموعة صغيرة (micro-cluster)، يحتوي على ميزة التجميع (Clustering Feature) ومؤشر إلى العقدة التالية في القائمة المتصلة للأوراق.
قائمة الأوراق المتصلة (Leaf Linked List)
هيكل في شجرة CF يربط جميع الأوراق للمسح المتسلسل الفعال أثناء مرحلة التجميع الكلي (macro-clustering).
امتصاص نقطة (Point Absorption)
عملية في BIRCH حيث يتم دمج نقطة بيانات جديدة في أقرب مجموعة صغيرة (micro-cluster) إذا لم تتجاوز الإضافة عتبة القطر.
انقسام العقدة (Node Splitting)
آلية يتم تشغيلها في BIRCH عندما تؤدي إضافة نقطة إلى تجاوز عتبة القطر أو عامل التفرع، مما يؤدي إلى تقسيم العقدة للحفاظ على القيود.
مرحلة إعادة البناء (Rebuilding Phase)
خطوة اختيارية في BIRCH حيث يتم إعادة بناء شجرة CF بعتبة قطر أقل لزيادة دقة التجميع قبل المرحلة النهائية.
التكلفة الحسابية التزايدية
ميزة رئيسية لـ BIRCH، حيث تكون تكلفة إدراج نقطة بيانات لوغاريتمية بالنسبة لعدد النقاط، مما يجعل الخوارزمية قابلة للتوسع بشكل كبير.
ملخص المجموعة (Cluster Summary)
مفهوم أساسي في BIRCH حيث يتم تمثيل مجموعة من النقاط بواسطة ملخص إحصائي (CF) بدلاً من النقاط الفردية، مما يقلل من مساحة الذاكرة.