Benchmarks e Avaliação
MMLU-Pro
Versão estendida do MMLU que inclui perguntas mais complexas que exigem raciocínio em várias etapas, projetada para diferenciar melhor o desempenho de modelos avançados com problemas que exigem uma compreensão aprofundada e deduções lógicas.
← Voltar