Глоссарий ИИ
Полный словарь искусственного интеллекта
Кривая валидации
График, показывающий производительность модели на отдельном наборе валидации параллельно с кривой обучения для обнаружения переобучения.
Точка сходимости
Момент, когда кривые обучения и валидации стабилизируются, указывая на то, что добавление дополнительных данных больше не улучшит производительность значимо.
Разрыв обобщения
Разница между производительностью на обучающих данных и данных валидации, измеряющая способность модели обобщать на новые данные.
Ошибка обучения
Мера ошибки, совершаемой моделью на обучающем наборе, служащая ориентиром для оценки потенциального переобучения.
Ошибка валидации
Производительность модели, оцененная на наборе данных, не использовавшемся во время обучения, отражающая её реальную способность к обобщению.
Плато обучения
Фаза, когда добавление дополнительных обучающих данных больше не приводит к значительному улучшению производительности модели.
Диагностика смещения
Анализ кривой обучения для определения, страдает ли модель от недообучения (высокое смещение), требующего более сложной модели.
Диагностика дисперсии
Идентификация переобучения (высокая дисперсия), когда ошибка обучения низкая, но ошибка валидации остается высокой.
Сложность модели
Фактор, влияющий на форму кривой обучения, где слишком сложная модель склонна к переобучению, а слишком простая - к недообучению.
Критический размер выборки
Минимальное количество обучающих данных, необходимое для достижения стабильной и обобщаемой производительности модели.
Кривая обучения по классам
Раздельный анализ кривых обучения для каждого выходного класса, особенно полезный в задачах несбалансированной классификации.
Предельная норма улучшения
Мера прироста производительности, получаемого при добавлении дополнительных единиц обучающих данных, помогающая решить о целесообразности сбора большего количества данных.
Итерационная перекрестная проверка
Техника, сочетающая перекрестную проверку и кривые обучения для надежной оценки производительности при различных размерах выборки.
Шум в данных
Случайная ошибка в обучающих данных, которая влияет на форму кривой обучения и ограничивает достижимую производительность модели.