تقييم أنظمة التوصية - مسرد الذكاء الاصطناعي

📖

المصطلحات

الدقة عند K

مقياس يقيس نسبة العناصر ذات الصلة بين أول K توصية، وهو أمر أساسي لتقييم جودة النتائج الأعلى ترتيبًا.

📖

المصطلحات

الاستدعاء عند K

مؤشر يحسب نسبة العناصر ذات الصلة الموجودة بالفعل في أول K توصية مقارنة بإجمالي العناصر ذات الصلة المتاحة.

📖

المصطلحات

متوسط الدقة المتوسط (MAP)

مقياس مجمّع يحسب متوسط الدقة في كل موضع ذي صلة، مرجحًا حسب ترتيب كل عنصر ذي صلة في قائمة التوصيات.

📖

المصطلحات

المكاسب التراكمية المخفضة الموحدة (NDCG)

درجة موحدة تقيم جودة الترتيب من خلال معاقبة العناصر ذات الصلة الموضوعة بعيدًا في بداية القائمة، مثالية للتوصيات ذات الصلة المتدرجة.

📖

المصطلحات

جذر متوسط مربع الخطأ (RMSE)

خطأ مربع متوسط يستخدم لتقييم دقة التنبؤات بالتقييمات من خلال قياس الفارق بين القيم المتوقعة والفعلية.

📖

المصطلحات

معدل النجاح (HR)

نسبة الجلسات التي يظهر فيها عنصر واحد على الأقل ذو صلة في أول N توصية، ويقيس الأداء العام للنظام.

📖

المصطلحات

تغطية الكتالوج

نسبة العناصر الفريدة في الكتالوج التي يمكن للنظام توصيتها، وهو أمر حاسم لتجنب التركيز على مجموعة فرعية محدودة من العناصر.

📖

المصطلحات

التنوع داخل القائمة

قياس متوسط عدم التشابه بين العناصر في نفس قائمة التوصيات، وهو أمر أساسي لتجنب التكرار وإثراء تجربة المستخدم.

📖

المصطلحات

الجدة

درجة مجهولية العناصر الموصى بها للمستخدم، المحسوبة كعكس شعبيتها الإجمالية في الكتالوج.

📖

المصطلحات

المصادفة السعيدة

قدرة النظام على توصية عناصر ذات صلة ولكن غير متوقعة تفاجئ المستخدم إيجابياً يتجاوز مجرد التنبؤات البسيطة.

📖

المصطلحات

اختبار A/B

منهجية تجريبية مقارنة أداء نسختين من النظام على شرائح من المستخدمين الحقيقيين لقياس الأثر التجاري.

📖

المصطلحات

التحقق المتقاطع ترك واحد

تقنية تقييم قوية حيث يتم استخدام كل تفاعل مستخدم بالتناوب كبيانات اختبار بينما تخدم التفاعلات الأخرى للتدريب.

📖

المصطلحات

التقييم خارجي مقابل على الإنترنت

نهج مزدوج يقيم الأداء على البيانات التاريخية (خارجي) ومع التفاعلات الحقيقية (عبر الإنترنت) للتحقق من فعالية النظام الكاملة.

📖

المصطلحات

التعميم الزمني

قدرة النظام على الحفاظ على أدائه على البيانات المستقبلية، المقيّمة بشكل متسلسل على تجزئات زمنية بدلاً من تجزئات عشوائية.

📖

المصطلحات

ارتباط المقاييس التجارية

تحليل العلاقة بين المقاييس الخوارزمية (NDCG، الدقة) ومؤشرات الأعمال (التحويل، الاحتفاظ) للتحقق من الصلة التجارية.

📖

المصطلحات

مقياس كاتاراكت

نتيجة مركبة توازن بين الدقة والتنوع والجدة والتغطية لتقييم الجودة الشاملة للتوصيات.

📖

المصطلحات

الترتيب المتبادل المتوقع (ERR)

نموذج احتمالي مبني على سلوك المستخدم يفترض توقف الفحص بعد النقرة الأولى، مع ترجيح قوي للمواضع الأولى.

📖

المصطلحات

تغطية المستخدم

نسبة المستخدمين الذين يمكن للنظام إنشاء توصيات لهم، حاسمة لقياس قابلية تطبيق النظام الشاملة.

📖

المصطلحات

مقاييس العدالة

مؤشرات تقيس عدالة توزيع التوصيات بين مختلف المجموعات الديموغرافية لتجنب التحيزات الخوارزمية.

📖

المصطلحات

قياس تحيز التعرض

كمية التفاوت في التعرض بين العناصر الشائعة وعناصر الذيل الطويل، أساسية لتقييم توازن التوصيات.

قاموس الذكاء الاصطناعي

الدقة عند K

الاستدعاء عند K

متوسط الدقة المتوسط (MAP)

المكاسب التراكمية المخفضة الموحدة (NDCG)

جذر متوسط مربع الخطأ (RMSE)

معدل النجاح (HR)

تغطية الكتالوج

التنوع داخل القائمة

الجدة

المصادفة السعيدة

اختبار A/B

التحقق المتقاطع ترك واحد

التقييم خارجي مقابل على الإنترنت

التعميم الزمني

ارتباط المقاييس التجارية

مقياس كاتاراكت

الترتيب المتبادل المتوقع (ERR)

تغطية المستخدم

مقاييس العدالة

قياس تحيز التعرض

لم يتم العثور على نتائج