المعايير والتقييم
TruthfulQA
معيار مصمم لقياس ميل نماذج اللغة الكبيرة (LLMs) إلى توليد إجابات صحيحة بدلاً من تكرار معلومات خاطئة شائعة في بيانات التدريب، مما يقيم القدرة على التمييز بين الحقيقة والخطأ.
← رجوع