قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الاختبار أ/ب
منهجية تجريبية تقارن بين إصدارين (أ و ب) من نموذج أو خدمة لتحديد أيهما يعمل بشكل أفضل وفقًا لمقاييس محددة مسبقًا، عادةً من خلال توزيع عشوائي لحركة المرور.
الاختبار متعدد المتغيرات
تقنية متقدمة تختبر عدة متغيرات وتوليفاتها في وقت واحد لتحديد التحسين الشامل، مما يسمح بتقييم التفاعل بين العوامل المختلفة للنموذج.
النشر الأزرق الأخضر
نمط نشر مع بيئتين متطابقتين يتم فيها تحويل حركة المرور بالكامل من الإصدار القديم (الأزرق) إلى الإصدار الجديد (الأخضر) بعد التحقق الكامل، مما يقلل من وقت التوقف.
علم الميزة
آلية تحكم تتيح تفعيل/تعطيل وظائف أو نماذج معينة بشكل ديناميكي دون إعادة نشر، مما يسهل التجارب والتراجعات السريعة.
تقسيم حركة المرور
تقنية توجيه ذكي تقوم بتوزيع الطلبات بشكل متناسب بين إصدارات مختلفة من النماذج وفقًا لقواعد قابلة للتكوين للاختبارات أ/ب أو النشر التدريجي.
الدلالة الإحصائية
مقياس احتمالي يحدد ما إذا كانت الفروق الملاحظة بين المتغيرات المختبرة ناتجة عن تأثيرات حقيقية وليس الصدفة، عادةً مع عتبة p-value < 0.05.
القيمة الاحتمالية
احتمالية ملاحظة نتائج على الأقل متطرفة مثل تلك المقاسة إذا كانت الفرضية الصفرية صحيحة، وتعمل كمعيار قرار في اختبارات الفرضيات.
فترة الثقة
نطاق من القيم المقدرة التي تحتوي باحتمالية محددة (عادةً 95%) على القيمة الحقيقية للمعلمة المقاسة، وتكمّل عدم اليقين في التقديرات التجريبية.
مجموعة التحكم
عينة من السكان تتلقى النسخة المرجعية (عادةً النموذج الحالي) وتُستخدم كخط أساسي للمقارنة الإحصائية مع المتغيرات التجريبية.
مجموعة العلاج
جزء من السكان المعرضين للنسخة التجريبية من النموذج أو العلاج المختبر، مما يسمح بقياس التأثير النسبي مقارنة بمجموعة التحكم.
النموذج المرجعي
النموذج المرجعي المستخدم كنقطة مقارنة لتقييم التحسينات التي تجلبها النسخ الجديدة، وغالباً ما يكون النموذج قيد الإنتاج حالياً.
البطل-التحدي
استراتيجية منافسة مستمرة حيث يتم تحدي النموذج البطل الحالي باستمرار من خلال نماذج التحدي، ويحل الأفضل أداءً محل البطل تدريجياً.
النشر التدريجي
النشر التزايدي لنموذج جديد مع زيادة تدريجية في نسبة حركة المرور، مما يسمح بالتحقق المستمر وتقليل مخاطر التأثير السلبي.
منصة التجريب
بنية تحتية مركزية تدير دورة حياة التجارب الكاملة، من إنشاء المتغيرات إلى التحليل الإحصائي للنتائج وأتمتة القرارات.
انحراف المقاييس
ظاهرة التدهور التدريجي لمقاييس أداء النموذج في الإنتاج، يتم اكتشافها عبر المراقبة المستمرة وتتطلب إعادة تقييم دورية.
حساب حجم العينة
عملية إحصائية تحدد الحد الأدنى من الملاحظات المطلوبة لاكتشاف فرق مهم بقوة إحصائية معينة، وهو أمر أساسي لتخطيط الاختبارات.
الاختبار A/B البيزي
نهج بديل يستخدم الاحتمالات البيزية لتقييم المتغيرات، مما يسمح باتخاذ قرارات مستمرة مع عينات أصغر وتفسير بديهي للنتائج.
الاختبار المتسلسل
منهجية تحليل تسمح بتقييم النتائج على فترات محددة مسبقًا دون التضخيم في خطر الخطأ من النوع الأول، مما يحسن مدة وتكاليف التجارب.