Alignement et Sécurité
Human Preference Data
Dataset collecté à partir d'évaluations humaines comparatives entre différentes réponses de modèle, servant de base pour l'entraînement d'alignement et l'optimisation.
← Retour