🏠 Strona Główna
Benchmarki
📊 Wszystkie benchmarki 🦖 Dinozaur v1 🦖 Dinozaur v2 ✅ Aplikacje To-Do List 🎨 Kreatywne wolne strony 🎯 FSACB - Ostateczny pokaz 🌍 Benchmark tłumaczeń
Modele
🏆 Top 10 modeli 🆓 Darmowe modele 📋 Wszystkie modele ⚙️ Kilo Code
Zasoby
💬 Biblioteka promptów 📖 Słownik AI 🔗 Przydatne linki
📖
Benchmarks et Évaluation

WinoBias

Dataset conçu pour évaluer les biais de genre dans les LLM, utilisant des phrases avec des stéréotypes occupationnels pour mesurer si les modèles favorisent implicitement certains genres dans des contextes professionnels spécifiques.

← Wstecz