قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نمو الشجرة ورقة بورقة (Leaf-wise)
استراتيجية تقسيم الأشجار التي تختار الورقة ذات أكبر تقليل في الخسارة لتقسيمها، على عكس النمو مستوى بمستوى (level-wise)، مما يسمح بتقارب أسرع بعمق أقل.
تجميع الميزات (Feature Binning)
تقنية تحويل الميزات المستمرة إلى فترات منفصلة (bins) لتسريع حساب نقاط التقسيم وتقليل استهلاك الذاكرة، على حساب فقدان طفيف في الدقة.
أخذ العينات أحادية الجانب القائمة على التدرج (GOSS)
طريقة أخذ عينات مبتكرة من LightGBM تحتفظ بجميع الحالات ذات التدرجات الكبيرة وتجري أخذ عينات عشوائية على تلك ذات التدرجات الصغيرة، مما يسرع التدريب دون فقدان كبير في الدقة.
تجميع الميزات الحصرية (EFB)
خوارزمية لتقليل الأبعاد تحدد وتجمع الميزات المتنافية حصريًا (نادرًا ما تكون غير صفرية في نفس الوقت) في ميزة مركبة واحدة، مما يقلل عدد الميزات.
مخطط التدرجات (Histogram of Gradients)
هيكل بيانات يستخدمه LightGBM لتخزين التدرجات والهيسيان في مجموعات (bins)، مما يسمح بحساب سريع للإحصائيات لكل نقطة تقسيم محتملة أثناء بناء الأشجار.
الحد الأقصى لعدد الأوراق (Num Leaves)
المعلمة الرئيسية في LightGBM التي تتحكم في الحد الأقصى لعدد الأوراق في كل شجرة، وتؤثر بشكل مباشر على تعقيد النموذج ومفاضلة التحيز والتباين، وهي أكثر أهمية من `max_depth` لنمو الشجرة ورقة بورقة.
تنظيم L1 و L2 (L1 and L2 Regularization)
معلمات تنظيم (`lambda_l1`, `lambda_l2`) تُطبق على أوزان الأوراق للتحكم في تعقيد النموذج ومنع التجاوز (overfitting) عن طريق معاقبة الأوزان العالية وحجم الأوزان على التوالي.
الحد الأدنى للبيانات في الورقة (Min Data in Leaf)
الحد الأدنى لعدد العينات المطلوبة في ورقة (أو الحد الأدنى للوزن الإجمالي)، وهي معلمة رئيسية لتجنب إنشاء أوراق شديدة التخصص ومكافحة التجاوز في نماذج LightGBM.
معالجة ميزات CatBoost
قدرة LightGBM على التعامل مع الميزات الفئوية بشكل أصلي باستخدام تحويل محدد يقوم بربطها بأعداد صحيحة، مما يتجنب الترميز الأحادي اليدوي ويحسن الكفاءة.
الافراط في التخصيص بنمو الأوراق
خطر خاص بالنمو الورقي حيث يمكن للنموذج أن يفرط في التعلم عن طريق إنشاء أوراق عميقة ومتخصصة للغاية، مما يتطلب تنظيمًا متزايدًا (مثل `num_leaves`, `min_data_in_leaf`) للتحكم فيه.
DART (تقاطع الانقطاعات مع أشجار الانحدار الإضافية المتعددة)
نسخة من التعزيز (boosting) مطبقة في LightGBM والتي تطبق تقنية الانقطاع (dropout) على الأشجار السابقة عند إضافة شجرة جديدة، مما يحسن التنظيم والأداء على بعض مجموعات البيانات.