قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
اختيار السمات
عملية الاختيار التلقائي للسمات الأكثر صلة لنموذج خاضع للإشراف عن طريق التخلص من المتغيرات المتكررة أو غير المفيدة لتحسين الأداء وتقليل التعقيد.
ترميز العناوين
تحويل المتغيرات الفئوية إلى قيم رقمية صحيحة حيث تتلقى كل فئة فريدة معرفًا رقميًا مميزًا، مناسب للخوارزميات التي تتطلب مدخلات رقمية.
تحجيم السمات
تطبيع أو توحيد السمات الرقمية لإعادتها إلى نطاق قابل للمقارنة، ضروري للخوارزميات الحساسة لمقياس المتغيرات مثل SVM والشبكات العصبية.
السمات متعددة الحدود
إنشاء سمات جديدة عن طريق إنشاء مجموعات متعددة الحدود من المتغيرات الموجودة، مما يسمح بالتقاط العلاقات غير الخطية بين السمات والمتغير الهدف.
سمات التفاعل
إنشاء متغيرات جديدة تمثل التفاعلات بين السمات الموجودة، عادة عن طريق الضرب أو الجمع، للكشف عن التأثيرات التآزرية في البيانات الخاضعة للإشراف.
إزالة السمات التكرارية
خوارزمية اختيار تكرارية تبني نموذجًا، وتتخلص من السمات الأقل أهمية وفقًا لمعيار محدد، وتكرر هذه العملية حتى الوصول إلى العدد الأمثل للسمات.
ترميز الهدف
تقنية تحويل المتغيرات الفئوية باستخدام إحصائيات المتغير الهدف (المتوسط، الوسيط) لكل فئة، وبالتالي التقاط العلاقة مباشرة مع التنبؤ.
أهمية السمة
مقياس كمي لتأثير كل سمة على تنبؤات النموذج الخاضع للإشراف، محسوب بطرق مثل أهمية التبديل، وقيم SHAP، أو معاملات النموذج.
تحليل المكونات الرئيسية
تقنية تقليل الأبعاد الخطية التي تحول الخصائص إلى مكونات متعامدة غير مرتبطة، مما يزيد من التباين المفسر مع عدد محدود من الأبعاد.
التصنيف/التقطيع
عملية تحويل المتغيرات المستمرة إلى فئات منفصلة (bins) لتبسيط العلاقات، وإدارة القيم الشاذة، وتحسين أداء بعض الخوارزميات الخاضعة للإشراف.
هاش الخصائص
تقنية تقليل الأبعاد التي تطبق دالة التجزئة على الخصائص لتعيينها في فضاء ذي أبعاد ثابتة، مفيدة للبيانات عالية الأبعاد مع العديد من الفئات.
تعويض القيم المفقودة
مجموعة من الاستراتيجيات الإحصائية أو الخوارزمية لاستبدال القيم المفقودة في الخصائص بتقديرات مناسبة، وهو أمر ضروري للحفاظ على سلامة البيانات الخاضعة للإشراف.
تقاطع الخصائص
مزيج من الخصائص لإنشاء ميزات جديدة تمثل تفاعلات محددة، فعال بشكل خاص في النماذج الخطية لالتقاط العلاقات غير المضافة.
خطوة هندسة الخصائص
تسلسل مؤتمت وقابل للتكرار من التحويلات المطبقة على الخصائص، مما يدمج التنظيف والإنشاء والاختيار والتحجيم لضمان الاتساق بين التدريب والتنبؤ.
إنشاء خصائص خاصة بالمجال
تطوير خصائص تعتمد على الخبرة المهنية ومعرفة المجال، مما يخلق متغيرات معلوماتية تلتقط أنماطًا محددة غير واضحة في البيانات الأولية.
هندسة الخصائص الزمنية
إنشاء خصائص خاصة بالبيانات الزمنية مثل الميزات المتأخرة والإحصاءات المتدرجة والمكونات الزمنية والاتجاهات الموسمية لتحسين التنبؤات الخاضعة للإشراف الزمني.