📊 نتائج الاختبار
نظرة عامة على أداء نماذج الذكاء الاصطناعي المُقَيَّمة
النماذج المختبرة
مرجعتغطية الذكاء الاصطناعي
ممتازالمقاييس المُقَيَّمة
جديد🤖 النتائج حسب النموذج
الأداء التفصيلي لكل نموذج ذكاء اصطناعي تم اختباره
AMP
اختبار إنشاء صفحات AMP
Andromeda Alpha
نموذج تجريبي متقدم
ChatGPT-5
أحدث جيل من OpenAI
Claude Haiku 4.5
نسخة أنثروبيك الشعرية
Claude Sonnet 4.5
نسخة أنثروبيك المتوازنة
DeepSeek 3.1
نموذج صيني متقدم
Gemini 2.5
أحدث إصدار من Google
GLM 4.6
نموذج Zai-org
Grok Fast 1
نسخة xAI السريعة
Herme 4 405B
نموذج 405B بارامتر
Kimi K2
نسخة Kimi المتقدمة
Ling 1T
نموذج 1 تريليون بارامتر
LongCat Flash Chat
دردشة فائقة السرعة
Metal Llama 4 Maverick
نسخة غير تقليدية
MiniMax
نموذج مدمج ومحسن
Mistral
نموذج أوروبي
Pickle
نموذج متخصص
Qwen 3 Coder
متخصص في البرمجة
Supernova
نموذج انفجاري
Tongyi DeepResearch
متخصص في الأبحاث
🔬 المنهجية العلمية
نهجنا الصارم لتقييم نماذج الذكاء الاصطناعي
بروتوكول اختبار موحد
يتم تقييم كل نموذج وفقًا لمنهجية صارمة وقابلة للتكرار
📝 توليد الكود
التحليل الثابت للكود المُولَّد، الاختبارات الوحدوية وتقييم التعقيد الخوارزمي
🎯 الدقة الدلالية
تقييم مدى ملاءمة الردود للأسئلة والسياق
⚡ الأداء الزمني
قياس أوقات الاستجابة، الكمون وقدرة إدارة الحمل
🔄 التماسك السياقي
القدرة على الحفاظ على السياق عبر المحادثات الطويلة والتفاعلات المعقدة