Benchmarks e Avaliação
Winogrande
Dataset de resolução de ambiguidade anafórica em larga escala usando esquemas Winograd, testando a compreensão do senso comum através de frases onde a resolução correta depende de conhecimentos do mundo real.
← Voltar