المعايير والتقييم
SuperGLUE
نسخة محسنة من GLUE تقدم مهامًا أكثر تعقيدًا تتطلب استدلالًا متقدمًا، مصممة خصيصًا لتقييم نماذج اللغة الكبيرة الحديثة (LLMs) وتجنب الأداء الأقصى الذي تم الوصول إليه باستخدام معيار GLUE الأصلي.
← رجوع