BenchVibe AI Ecosystem

VIP 👤

🏠 Strona Główna

Benchmarki

📊 Wszystkie benchmarki 🦖 Dinozaur v1 🦖 Dinozaur v2 ✅ Aplikacje To-Do List 🎨 Kreatywne wolne strony 🎯 FSACB - Ostateczny pokaz 🌍 Benchmark tłumaczeń

Modele

🏆 Top 10 modeli 🆓 Darmowe modele 📋 Wszystkie modele ⚙️ Kilo Code

Zasoby

💬 Biblioteka promptów 📖 Słownik AI 🔗 Przydatne linki

📖

RLHF (Reinforcement Learning from Human Feedback)

Human Preference Dataset

Ensemble de données collectées où des évaluateurs humains comparent différentes réponses du modèle, créant des classements qui servent de base pour entraîner le modèle de récompense.

← Wstecz