🏠 Beranda
Benchmark
📊 Semua Benchmark 🦖 Dinosaurus v1 🦖 Dinosaurus v2 ✅ Aplikasi To-Do List 🎨 Halaman Bebas Kreatif 🎯 FSACB - Showcase Utama 🌍 Benchmark Terjemahan
Model
🏆 Top 10 Model 🆓 Model Gratis 📋 Semua Model ⚙️ Kilo Code
Sumber Daya
💬 Perpustakaan Prompt 📖 Glosarium AI 🔗 Tautan Berguna
📖
Benchmarks et Évaluation

MMLU-Pro

Version étendue de MMLU incluant des questions plus complexes nécessitant un raisonnement en plusieurs étapes, conçue pour mieux différencier les performances des modèles avancés avec des problèmes qui exigent une compréhension approfondie et des déductions logiques.

← Kembali