RLHF (Reinforcement Learning from Human Feedback)
Human Preference Dataset
Ensemble de données collectées où des évaluateurs humains comparent différentes réponses du modèle, créant des classements qui servent de base pour entraîner le modèle de récompense.
← 뒤로