غابة عشوائية متوازنة

📖

المصطلحات

نوع من الغابة العشوائية مصمم للتعامل مع مجموعات البيانات غير المتوازنة من خلال إنشاء أشجار قرار على عينات فرعية bootstrap حيث يتم تمثيل كل فئة بشكل متساوٍ.

📖

المصطلحات

Bootstrap المتوازن

تقنية أخذ عينات حيث يتم في كل تكرار سحب عينة bootstrap بطريقة تضمن تمثيلاً متساوياً للفئات، غالباً عن طريق تقليل عينات الفئة الأغلبية أو زيادة عينات الفئة الأقلية.

📖

المصطلحات

تقليل عينات الفئة الأغلبية

طريقة لتقليل عدم التوازن بين الفئات تتضمن إزالة عشوائية لملاحظات من الفئة الأغلبية لتقليل هيمنتها في مجموعة بيانات التدريب.

📖

المصطلحات

زيادة عينات الفئة الأقلية

تقنية تهدف إلى زيادة عدد ملاحظات الفئة الأقلية، إما عن طريق التكرار أو عن طريق توليد ملاحظات جديدة اصطناعية، لتحقيق توازن في توزيع الفئات.

📖

المصطلحات

عينة Bootstrap

عينة عشوائية مسحوبة مع الإعادة من مجموعة البيانات الأصلية، تُستخدم في طرق التجميع لتدريب كل نموذج من المجموعة على مجموعة فرعية مختلفة قليلاً من البيانات.

📖

المصطلحات

مؤشر جيني

مقياس لنقاء العقدة في شجرة القرار، يقيس احتمالية أن تكون الملاحظة المختارة عشوائياً من العقدة مصنفة بشكل خاطئ إذا تم تسميتها عشوائياً وفقاً لتوزيع الفئات.

📖

المصطلحات

مساحة تحت منحنى خصائص تشغيل المستقبل (AUC-ROC)

مقياس أداء يقدر قدرة المصنف على التمييز بين الفئات، ويمثل المساحة تحت المنحنى الذي يرسم معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة.

📖

المصطلحات

EasyEnsemble

خوارزمية تعلم تجميعية تنشئ عدة مجموعات فرعية من الفئة الأغلبية، وتدرب مصنفاً على كل مجموعة فرعية مدمجة مع كامل الفئة الأقلية، وتجمع التوقعات.

📖

المصطلحات

التوازن المتتالي

طريقة تكرارية تعتمد على المجموعات تُدرّب المصنفات بشكل تسلسلي على مجموعات بيانات متوازنة بشكل متزايد، حيث تُزال الأمثلة المصنفة بشكل صحيح من الفئة الأغلبية في كل مرحلة.

📖

المصطلحات

الاستدعاء (التذكر أو الحساسية)

مقياس يقيس نسبة المشاهدات الإيجابية الحقيقية التي تم تحديدها بشكل صحيح بواسطة النموذج، وهو أساسي لتقييم الأداء على الفئة الأقلية.

قاموس الذكاء الاصطناعي