Глоссарий ИИ
Полный словарь искусственного интеллекта
Простая линейная регрессия
Статистическая модель, которая устанавливает линейную зависимость между одной независимой переменной и непрерывной зависимой переменной в виде Y = β₀ + β₁X + ε.
Множественная линейная регрессия
Расширение линейной регрессии, использующее несколько независимых переменных для прогнозирования непрерывной зависимой переменной по формуле Y = β₀ + ΣβᵢXᵢ + ε.
Коэффициент детерминации (R²)
Статистическая метрика, варьирующая от 0 до 1, измеряющая долю дисперсии зависимой переменной, объясненной моделью регрессии.
Метод наименьших квадратов (МНК)
Метод оценки параметров регрессии, минимизирующий сумму квадратов остатков между наблюдаемыми и предсказанными значениями.
Остатки
Различия между наблюдаемыми значениями и значениями, предсказанными моделью регрессии, представляющие ошибки прогнозирования.
Мультиколлинеарность
Феномен, при котором несколько независимых переменных сильно коррелируют друг с другом, делая оценку коэффициентов нестабильной.
Гетероскедастичность
Нарушение гипотезы о гомоскедастичности, при котором дисперсия остатков не является постоянной на всех уровнях независимых переменных.
Влиятельные значения
Наблюдения, которые, если их удалить из набора данных, вызовут существенные изменения в оценках коэффициентов.
Расстояние Кука
Статистика, измеряющая влияние отдельного наблюдения на предсказанные значения регрессионной модели.
Ридж-регрессия
Метод регуляризации, добавляющий L2-штраф к коэффициентам для уменьшения дисперсии и борьбы с мультиколлинеарностью.
Регрессия LASSO
Метод регуляризации, использующий L1-штраф, который может обнулить некоторые коэффициенты, выполняя отбор признаков.
Компромисс между смещением и дисперсией
Фундаментальный компромисс между ошибкой смещения (чрезмерное упрощение) и ошибкой дисперсии (чрезмерная подгонка к обучающим данным).
Градиентный спуск
Итеративный алгоритм оптимизации, настраивающий коэффициенты для минимизации функции потерь путём следования в направлении отрицательного градиента.
Предиктивный интервал
Диапазон вероятных значений, содержащий будущее индивидуальное наблюдение с заданным уровнем доверия; он шире, чем доверительный интервал.
Тест на значимость
Статистический тест, оценивающий, значительно ли отличается коэффициент регрессии от нуля, обычно с использованием t-статистики.