Оценка и метрики
Выравнивание
Процесс и метрика, направленные на то, чтобы поведение большой языковой модели (LLM) соответствовало человеческим намерениям, этическим ценностям и заданным инструкциям. Оценка выравнивания проверяет, является ли модель полезной, безобидной и честной (HHH framework).
← Назад