Глоссарий ИИ
Полный словарь искусственного интеллекта
Смещение априорной вероятности
Изменение распределения целевой переменной (y), в то время как условное распределение P(X|y) остается постоянным, влияя на прогнозы модели.
Индекс стабильности популяции (PSI)
Количественная метрика, измеряющая разницу в распределении между двумя наборами данных (например, обучающими и производственными), используемая для обнаружения и количественной оценки сдвига данных.
Тест Колмогорова-Смирнова (KS)
Непараметрический статистический тест, сравнивающий кумулятивные функции распределения двух выборок для определения, происходят ли они из одного и того же распределения.
Расстояние Хеллингера
Метрика сходства между двумя распределениями вероятностей, ограниченная между 0 и 1, используемая для количественной оценки величины сдвига данных интерпретируемым образом.
Порог обнаружения сдвига
Предопределенное критическое значение для метрики сдвига (например, PSI), превышение которого вызывает предупреждение о деградации данных для переоценки модели.
Окно ссылок
Временной период или набор данных, используемый как стабильная основа для сравнения будущих распределений и идентификации сдвига данных.
Окно обнаружения
Скользящий временной интервал на производственных данных, на котором вычисляются статистики для сравнения с окном ссылок при мониторинге сдвига.
Обнаружение сдвига по признакам
Анализ сдвига на уровне каждой отдельной переменной (признака) для идентификации конкретных характеристик, распределение которых изменилось, упрощая диагностику.
Многомерное обнаружение дрейфа
Подход, анализирующий одновременные изменения в совместном распределении нескольких признаков, способный обнаружить дрейфы, невидимые на одномерном уровне.
Инкрементальное обнаружение дрейфа
Методы обнаружения, которые обновляют эталонные статистики по мере поступления новых данных, адаптируя модель к постепенным изменениям.
Адаптивное окно
Техника, при которой размер окна обнаружения динамически регулируется в зависимости от обнаруженной скорости изменений, обеспечивая переменную реактивность к дрейфам.
Анализ первопричин дрейфа
Процесс исследования, направленный на идентификацию фундаментального источника дрейфа данных (например: изменение процесса, ошибка сбора данных, эволюция поведения пользователей).
Триггер переобучения модели
Автоматизированное условие, часто основанное на превышении порога дрейфа, которое инициирует процесс переобучения или обновления модели машинного обучения.
Статистический контроль процессов (SPC) для МО
Применение методов промышленного контроля качества, таких как контрольные карты, к мониторингу метрик моделей для надежного обнаружения дрейфа.