🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
المعايير والتقييم

TruthfulQA

معيار مصمم لقياس ميل نماذج اللغة الكبيرة (LLMs) إلى توليد إجابات صحيحة بدلاً من تكرار معلومات خاطئة شائعة في بيانات التدريب، مما يقيم القدرة على التمييز بين الحقيقة والخطأ.

← رجوع