قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الدقة عند K
مقياس يقيس نسبة العناصر ذات الصلة بين أول K توصية، وهو أمر أساسي لتقييم جودة النتائج الأعلى ترتيبًا.
الاستدعاء عند K
مؤشر يحسب نسبة العناصر ذات الصلة الموجودة بالفعل في أول K توصية مقارنة بإجمالي العناصر ذات الصلة المتاحة.
متوسط الدقة المتوسط (MAP)
مقياس مجمّع يحسب متوسط الدقة في كل موضع ذي صلة، مرجحًا حسب ترتيب كل عنصر ذي صلة في قائمة التوصيات.
المكاسب التراكمية المخفضة الموحدة (NDCG)
درجة موحدة تقيم جودة الترتيب من خلال معاقبة العناصر ذات الصلة الموضوعة بعيدًا في بداية القائمة، مثالية للتوصيات ذات الصلة المتدرجة.
جذر متوسط مربع الخطأ (RMSE)
خطأ مربع متوسط يستخدم لتقييم دقة التنبؤات بالتقييمات من خلال قياس الفارق بين القيم المتوقعة والفعلية.
معدل النجاح (HR)
نسبة الجلسات التي يظهر فيها عنصر واحد على الأقل ذو صلة في أول N توصية، ويقيس الأداء العام للنظام.
تغطية الكتالوج
نسبة العناصر الفريدة في الكتالوج التي يمكن للنظام توصيتها، وهو أمر حاسم لتجنب التركيز على مجموعة فرعية محدودة من العناصر.
التنوع داخل القائمة
قياس متوسط عدم التشابه بين العناصر في نفس قائمة التوصيات، وهو أمر أساسي لتجنب التكرار وإثراء تجربة المستخدم.
الجدة
درجة مجهولية العناصر الموصى بها للمستخدم، المحسوبة كعكس شعبيتها الإجمالية في الكتالوج.
المصادفة السعيدة
قدرة النظام على توصية عناصر ذات صلة ولكن غير متوقعة تفاجئ المستخدم إيجابياً يتجاوز مجرد التنبؤات البسيطة.
اختبار A/B
منهجية تجريبية مقارنة أداء نسختين من النظام على شرائح من المستخدمين الحقيقيين لقياس الأثر التجاري.
التحقق المتقاطع ترك واحد
تقنية تقييم قوية حيث يتم استخدام كل تفاعل مستخدم بالتناوب كبيانات اختبار بينما تخدم التفاعلات الأخرى للتدريب.
التقييم خارجي مقابل على الإنترنت
نهج مزدوج يقيم الأداء على البيانات التاريخية (خارجي) ومع التفاعلات الحقيقية (عبر الإنترنت) للتحقق من فعالية النظام الكاملة.
التعميم الزمني
قدرة النظام على الحفاظ على أدائه على البيانات المستقبلية، المقيّمة بشكل متسلسل على تجزئات زمنية بدلاً من تجزئات عشوائية.
ارتباط المقاييس التجارية
تحليل العلاقة بين المقاييس الخوارزمية (NDCG، الدقة) ومؤشرات الأعمال (التحويل، الاحتفاظ) للتحقق من الصلة التجارية.
مقياس كاتاراكت
نتيجة مركبة توازن بين الدقة والتنوع والجدة والتغطية لتقييم الجودة الشاملة للتوصيات.
الترتيب المتبادل المتوقع (ERR)
نموذج احتمالي مبني على سلوك المستخدم يفترض توقف الفحص بعد النقرة الأولى، مع ترجيح قوي للمواضع الأولى.
تغطية المستخدم
نسبة المستخدمين الذين يمكن للنظام إنشاء توصيات لهم، حاسمة لقياس قابلية تطبيق النظام الشاملة.
مقاييس العدالة
مؤشرات تقيس عدالة توزيع التوصيات بين مختلف المجموعات الديموغرافية لتجنب التحيزات الخوارزمية.
قياس تحيز التعرض
كمية التفاوت في التعرض بين العناصر الشائعة وعناصر الذيل الطويل، أساسية لتقييم توازن التوصيات.