Alignement et Sécurité
Preference Learning
Domaine du machine learning où les modèles apprennent à partir de comparaisons entre différentes options pour capturer les préférences humaines et s'y aligner.
← Retour