Benchmarks et Évaluation
MMLU-Pro
Version étendue de MMLU incluant des questions plus complexes nécessitant un raisonnement en plusieurs étapes, conçue pour mieux différencier les performances des modèles avancés avec des problèmes qui exigent une compréhension approfondie et des déductions logiques.
← Kembali