Выравнивание и безопасность
Согласование безопасности
Совокупность методов, направленных на обеспечение того, чтобы языковые модели избегали генерации вредного, опасного или неуместного контента, сохраняя при этом общую производительность.
← Назад