قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
C4.5
خوارزمية التعلم الخاضع للإشراف التي طورها كوينلان في عام 1993، وهي امتداد لـ ID3 قادر على التعامل مع السمات المستمرة والبيانات المفقودة، باستخدام نسبة الربح كمعيار للانقسام.
C5.0
نسخة محسّنة من C4.5 طورها كوينلان، تقدم أداءً فائقًا، وإدارة أكثر كفاءة لمجموعات البيانات الكبيرة، وقدرة على توليد مجموعات من الأشجار (التعزيز).
نسبة الربح
معيار الانقسام المستخدم في C4.5 لتصحيح تحيز كسب المعلومات نحو السمات التي لها قيم كثيرة، ويُحسب ككسب المعلومات مقسومًا على الانتروبيا الجوهرية للسمة.
الانتروبيا الجوهرية
مقياس يستخدم في حساب نسبة الربح لعقاب السمات ذات العدد الكبير من القيم، ويمثل كمية المعلومات المحتملة الموجودة في توزيع قيم سمة معينة.
التحويل الثنائي
تقنية يستخدمها C4.5 لتحويل السمات المستمرة إلى سمات فئوية ثنائية عن طريق تحديد نقطة الانقسام المثلى التي تعظم كسب المعلومات.
إدارة القيم المفقودة
قدرة C4.5 على معالجة الحالات ذات السمات المفقودة باستخدام طرق الترجيح الاحتمالي أو توزيع الحالة جزئيًا حسب الفروع الممكنة.
التقليم المتشائم
طريقة لتقليل التعقيد في C4.5 تزيل الفروع غير الأساسية باستخدام تقدير إحصائي متشائم للخطأ بناءً على التوزيع ذي الحدين.
تعزيز C5.0
تقنية التعلم الجماعي المنفذة في C5.0 التي تجمع بين عدة أشجار قرار ضعيفة لإنشاء مصنف قوي، مما يحسن دقة التنبؤ بشكل كبير.
نقطة القطع المثلى
الحد الأدنى للقيمة المحددة بواسطة C4.5 لتقسيم سمة مستمرة إلى فترتين، يتم اختيارها لتعظيز مكسب المعلومات من التقسيم الناتج.
مكسب المعلومات الموحد
متغير من مكسب المعلومات يستخدم في بعض السياقات لتجنب التحيز، يشبه نسبة المكسب ولكن مع نهج رياضي مختلف قليلاً للتسوية.
شجرة القرار C4.5
بنية هرمية يتم إنتاجها بواسطة خوارزمية C4.5 حيث تمثل كل عقدة داخلية اختبارًا على سمة، وتمثل كل فرع نتيجة اختبار، وتمثل كل ورقة تسمية فئة.
نافذة منزلقة C5.0
تحسين في C5.0 لمعالجة مجموعات البيانات الكبيرة بكفاءة باستخدام نافذة من العينات التي تنتقل عبر مجموعة البيانات الكاملة عند بناء الشجرة.
معامل الثقة
معامل في C4.5 (عادةً 25%) يستخدم في تقدير الخطأ للتقليم، يتحكم في مستوى التشاؤم في تقييم أداء فروع الشجرة.
قواعد IF-THEN C4.5
تمثيل بديل لأشجار القرار يتم إنشاؤه بواسطة C4.5 حيث يتم تحويل كل مسار من الجذر إلى الورقة إلى قاعدة تصنيف شرطية.
التعقيد الحسابي C4.5
التكلفة الخوارزمية لـ C4.5 من ترتيب O(n * m * log n) حيث n هو عدد الحالات و m هو عدد السمات، يتم تحسينه بتقنيات الفرز والحساب التزايدي.
التقسيم متعدد المسارات
قدرة C4.5 على إنشاء عقد بأكثر من فرعين للسمات الفئوية، على عكس الخوارزميات الأخرى التي تقتصر على التقسيمات الثنائية.