🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
المعايير والتقييم

GSM8K

مجموعة بيانات تحتوي على 8.5 آلاف مشكلة رياضية نصية على مستوى المدرسة تتطلب استدلالًا متعدد الخطوات، وتقيم قدرة نماذج اللغات الكبيرة (LLMs) على فهم المشاكل باللغة الطبيعية وتوليد حلول رياضية متسقة.

← رجوع