Alignement et Sécurité
Harmlessness Training
Processus d'entraînement spécifique visant à enseigner aux modèles à éviter de générer du contenu potentiellement nuisible, dangereux ou préjudiciable pour les utilisateurs.
← Retour