Sécurité et Alignement
Preference Modeling
Processus d'apprentissage des préférences humaines complexes pour guider les modèles d'IA vers des comportements jugés souhaitables par les utilisateurs.
← Quay lại