قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
غابة عشوائية متوازنة
نوع من الغابة العشوائية مصمم للتعامل مع مجموعات البيانات غير المتوازنة من خلال إنشاء أشجار قرار على عينات فرعية bootstrap حيث يتم تمثيل كل فئة بشكل متساوٍ.
Bootstrap المتوازن
تقنية أخذ عينات حيث يتم في كل تكرار سحب عينة bootstrap بطريقة تضمن تمثيلاً متساوياً للفئات، غالباً عن طريق تقليل عينات الفئة الأغلبية أو زيادة عينات الفئة الأقلية.
تقليل عينات الفئة الأغلبية
طريقة لتقليل عدم التوازن بين الفئات تتضمن إزالة عشوائية لملاحظات من الفئة الأغلبية لتقليل هيمنتها في مجموعة بيانات التدريب.
زيادة عينات الفئة الأقلية
تقنية تهدف إلى زيادة عدد ملاحظات الفئة الأقلية، إما عن طريق التكرار أو عن طريق توليد ملاحظات جديدة اصطناعية، لتحقيق توازن في توزيع الفئات.
عينة Bootstrap
عينة عشوائية مسحوبة مع الإعادة من مجموعة البيانات الأصلية، تُستخدم في طرق التجميع لتدريب كل نموذج من المجموعة على مجموعة فرعية مختلفة قليلاً من البيانات.
مؤشر جيني
مقياس لنقاء العقدة في شجرة القرار، يقيس احتمالية أن تكون الملاحظة المختارة عشوائياً من العقدة مصنفة بشكل خاطئ إذا تم تسميتها عشوائياً وفقاً لتوزيع الفئات.
مساحة تحت منحنى خصائص تشغيل المستقبل (AUC-ROC)
مقياس أداء يقدر قدرة المصنف على التمييز بين الفئات، ويمثل المساحة تحت المنحنى الذي يرسم معدل الإيجابيات الحقيقية مقابل معدل الإيجابيات الكاذبة.
EasyEnsemble
خوارزمية تعلم تجميعية تنشئ عدة مجموعات فرعية من الفئة الأغلبية، وتدرب مصنفاً على كل مجموعة فرعية مدمجة مع كامل الفئة الأقلية، وتجمع التوقعات.
التوازن المتتالي
طريقة تكرارية تعتمد على المجموعات تُدرّب المصنفات بشكل تسلسلي على مجموعات بيانات متوازنة بشكل متزايد، حيث تُزال الأمثلة المصنفة بشكل صحيح من الفئة الأغلبية في كل مرحلة.
الاستدعاء (التذكر أو الحساسية)
مقياس يقيس نسبة المشاهدات الإيجابية الحقيقية التي تم تحديدها بشكل صحيح بواسطة النموذج، وهو أساسي لتقييم الأداء على الفئة الأقلية.