Глоссарий ИИ
Полный словарь искусственного интеллекта
Теория экстремальных значений
Раздел статистики, изучающий асимптотическое поведение экстремумов распределения, позволяющий моделировать и предсказывать редкие события большой величины.
Робастная статистика
Совокупность статистических методов, устойчивых к нарушениям предположений и экстремальным значениям, обеспечивающих надежные оценки даже при наличии загрязненных данных.
Винзоризация
Статистическая техника преобразования, заменяющая экстремальные значения заданными квантилями, ограничивая тем самым влияние выбросов на анализ.
Расстояние Кука
Мера влияния в регрессионном анализе, идентифицирующая наблюдения, оказывающие непропорциональное влияние на оцененные параметры модели, сочетающая рычаговый эффект и остатки.
Точки рычага
Наблюдения с экстремальными значениями предикторов, которые могут оказывать чрезмерное влияние на коэффициенты регрессии, даже если они следуют ожидаемой модели.
Точка разрушения
Минимальная доля загрязнения, которую статистическая оценка может выдержать до получения произвольно неверных результатов, измеряющая робастность метода.
Кластеризация DBSCAN
Алгоритм кластеризации на основе плотности, способный автоматически идентифицировать кластеры произвольной формы и шумовые точки как экстремальные значения.
Тест Граббса
Параметрический статистический тест для обнаружения единственного выброса в нормально распределенных данных, основанный на стандартизированных стандартных отклонениях.
Метод Экстремальных Процентилей
Подход, идентифицирующий экстремальные значения на основе верхних или нижних процентилей распределения, обычно использующий 1% или 5% экстремальных значений в качестве порога.
Медианное Абсолютное Отклонение
Надежная мера дисперсии, рассчитываемая на основе медианных абсолютных отклонений, устойчивая к экстремальным значениям и являющаяся альтернативой стандартному отклонению.
Влиятельные Наблюдения
Точки данных, присутствие или отсутствие которых значительно изменяет результаты статистического анализа, обнаруживаемые с помощью мер, таких как расстояние Кука.
Границы Тьюки
Метод обнаружения экстремальных значений, использующий границы на основе межквартильного размаха, обычно 1.5*IQR для умеренных значений и 3*IQR для экстремальных.
Критерий Шовене
Классический статистический тест, идентифицирующий выбросы на основе вероятности появления наблюдения в предполагаемом нормальном распределении.