Benchmarks et Évaluation
WinoBias
Dataset conçu pour évaluer les biais de genre dans les LLM, utilisant des phrases avec des stéréotypes occupationnels pour mesurer si les modèles favorisent implicitement certains genres dans des contextes professionnels spécifiques.
← Wstecz