قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
معلومات الكسب
مقياس كمي يقيس انخفاض الانتروبيا الناتج عن تقسيم مجموعة بيانات حسب سمة معينة، يستخدمه ID3 لاختيار السمة المثلى للتقسيم في كل عقدة من عقد الشجرة.
انتروبي شانون
قياس رياضي لعدم اليقين أو الفوضى في مجموعة بيانات، يتم حسابه كمجموع سالب للاحتمالات مضروبة في لوغاريتمها الثنائي، ويشكل أساس حساب كسب المعلومات في ID3.
سمة التقسيم
متغير يتم اختياره في عقدة معينة لتقسيم مجموعة البيانات إلى مجموعات فرعية أكثر تجانساً، يختاره ID3 بناءً على أقصى كسب للمعلومات بين جميع السمات المتاحة.
عقدة ورقة
عقدة طرفية في شجرة القرار ID3 لا تحتوي على أي تقسيم إضافي، تمثل قراراً نهائياً أو تصنيفاً بناءً على الفئة الأغلبية للعينات الموجودة في هذه العقدة.
نسبة كسب المعلومات
متغير لكسب المعلومات معياري بالانتروبيا الذاتية للسمة، تم تقديمه لتصحيح تحيز ID3 نحو السمات التي لها العديد من القيم الممكنة.
مجموعة التدريب
مجموعة فرعية من البيانات يستخدمها ID3 لبناء شجرة القرار، تحتوي على أمثلة مصنفة مما يسمح للخوارزمية بتعلم العلاقات بين السمات والفئات المستهدفة.
التنبؤ بالفئة
عملية التصنيف في ID3 حيث تمر عينة جديدة عبر الشجرة من الجذر إلى ورقة، والفئة المتوقعة هي تلك المرتبطة بالعقدة الورقية التي تم الوصول إليها وفقاً لاختبارات السمات المتعاقبة.
عمق الشجرة
الحد الأقصى لعدد الفروع التي يتم عبورها من الجذر إلى أي ورقة في شجرة ID3، يؤثر بشكل مباشر على تعقيد النموذج وقدرته على التقاط الأنماط في البيانات.
معيار النقاء
مقياس تجانس الفئات في عقدة، حيث العقدة النقية تماماً تحتوي على عينات من فئة واحدة، وتكون أساساً لتقييم جودة التقسيمات في ID3.
المتغيرات التوضيحية
مجموعة من الخصائص التي يستخدمها ID3 لبناء شجرة القرار، حيث يتم تقييم كل منها لقدرته على التقسيم بناءً على قدرته على تقليل عدم اليقين بشأن المتغير الهدف.