Benchmarks et Évaluation
Winogrande
Dataset de résolution d'ambiguïté anaphorique à grande échelle utilisant des schémas Winograd, testant la compréhension du sens commun à travers des phrases où la résolution correcte dépend de connaissances du monde réel.
← Retour