قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
أهمية الميزة
مقياس يكمّل تأثير كل متغير تنبؤي في أداء نموذج الغابة العشوائية، المحسوب إما عن طريق متوسط انخفاض النقاء أو عن طريق التبديل العشوائي.
أهمية جيني
طريقة تقييم أهمية المتغيرات تعتمد على الانخفاض الإجمالي في نقاء جيني المتراكم على جميع العقد حيث يتم استخدام المتغير للقسمة.
متوسط انخفاض النقاء
تقنية تقيس أهمية متغير عن طريق متوسط انخفاض النقاء (جيني أو إنتروبيا) الذي يجلبه عند استخدامه كمعيار للقسمة في الأشجار.
أهمية التبديل
طريقة مستقلة عن النموذج لتقييم أهمية متغير عن طريق قياس تدهور أداء النموذج عند تبديل قيم هذا المتغير عشوائياً.
متوسط انخفاض الدقة
مؤشر لأهمية متغير يعتمد على الانخفاض المتوسط في دقة النموذج عند تبديل هذا المتغير في البيانات خارج العينة (out-of-bag).
مقياس النقاء
دالة رياضية تكمّل درجة عدم تجانس الفئات في عقدة، تستخدم لتحسين القسمات في أشجار القرار.
الربح المعلوماتي
معيار قسمة يقيس انخفاض الإنتروبيا المحصل عليه عند تقسيم عقدة حسب ميزة معينة، مع مراعاة القسمات التي تعظم التجانس الناتج.
مؤشر جيني
مقياس للنقاء يحسب احتمال أن تكون ملاحظة مصنفة عشوائياً غير صحيحة، ويقيّم عدم تجانس الفئات في عقدة شجرة القرار.
خطأ خارج العينة
تقدير خطأ غير متحيز يتم حسابه عن طريق تقييم كل شجرة على الملاحظات غير المستخدمة أثناء تدريبها، مما يعمل كتحقق متقاطع داخلي في غابة عشوائية.
اختيار الميزات
عملية تحديد والحفاظ على المتغيرات الأكثر صلة بناءً على درجات أهميتها، مما يزيل الميزات الزائدة عن الحاجة أو غير المفيدة.
مخطط أهمية المتغيرات
توصيف مرئي يرتب المتغيرات التنبؤية حسب درجة أهميتها المتناقصة، مما يسهل تفسير العوامل الأكثر تأثيراً في النموذج.
مخطط الاعتماد الجزئي
تمثيل رسومي يوضح التأثير الهامشي لمتغير واحد أو متغيرين على تنبؤ النموذج، بمتوسط جميع المتغيرات الأخرى.
عدم نقاء العقدة
درجة عدم تجانس الملاحظات في عقدة الشجرة، وتستخدم كأساس لحساب أهمية الميزات من خلال مساهمتها في تقليل هذا عدم النقاء.
معيار التقسيم
قاعدة تحدد التقسيم الأمثل للعقدة بناءً على ميزة وعتبة، مما يؤثر مباشرة على توزيع الأهمية بين المتغيرات.