RLHF (Reinforcement Learning from Human Feedback)
Alignment
Processus visant à faire correspondre le comportement des modèles d'IA avec les valeurs, intentions et préférences humaines pour garantir des interactions sûres et bénéfiques.
← Indietro