Глоссарий ИИ
Полный словарь искусственного интеллекта
Ошибка Out-of-Bag
Ошибка валидации, вычисленная на наблюдениях, не выбранных при бутстрэп-выборке, составляющая несмещенную оценку ошибки обобщения модели. OOB error служит альтернативой перекрестной проверке в ансамблевых методах, таких как Random Forest.
Бутстрэп-агрегирование (Bagging)
Ансамблевый метод, который обучает множественные модели на различных бутстрэп-выборках и объединяет их предсказания посредством мажоритарного голосования или усреднения для уменьшения дисперсии и улучшения предсказательной стабильности. Bagging особенно эффективен для нестабильных алгоритмов, таких как деревья решений.
Бутстрэп-доверительный интервал
Доверительный интервал, оцененный с помощью бутстрэп-ресемплинга для количественной оценки неопределенности параметров модели или метрик производительности. Существует несколько методов: перцентильный, BCa и базовые бутстрэп-интервалы.
Джекнйф-валидация
Техника систематического ресемплинга, где каждое наблюдение поочередно исключается для оценки смещения и дисперсии оценщика, рассматриваемая как аппроксимация бутстрэпа. Джекнйф менее затратен вычислительно, но менее гибок, чем бутстрэп.
Перестановочная валидация
Непараметрический метод валидации, который оценивает статистическую значимость модели путем случайной перестановки целевых меток для создания нулевого распределения производительности. Эта техника позволяет проверить, действительно ли модель изучает значимые паттерны.
Бутстрэп-коррекция смещения
Процедура, использующая бутстрэп для оценки и коррекции смещения оценщика или метрики оценки модели. Эта коррекция улучшает точность оценок, особенно на малых выборках.
BCa бутстрэп (Bias-Corrected and Accelerated)
Продвинутый бутстрэп-метод, который корректирует доверительные интервалы, исправляя смещение и ускорение (асимметрию) бутстрэп-распределения. BCa обеспечивает более точные интервалы, чем стандартный перцентильный метод.
Параметрический бутстрэп
Вариант бутстрэпа, где выборки генерируются из параметрического распределения, подобранного к данным, а не из прямого ресемплинга. Этот метод полезен, когда основная модель данных известна или предполагается.
Непараметрический бутстрэп
Классический бутстрэп-подход, который повторно выбирает с возвращением непосредственно из наблюдаемых данных без предположений о базовом распределении. Этот метод более гибкий и устойчив к нарушениям распределительных предположений.
Бутстрэп распределение выборки
Эмпирическое распределение статистики, полученное путем вычисления этой статистики на множественных бутстрэп-выборках, позволяющее оценить изменчивость и асимптотические свойства оценщика. Это распределение служит основой для бутстрэп-выводов.
Бутстрэп стандартная ошибка
Оценка стандартной ошибки статистики, вычисленная как стандартное отклонение ее бутстрэп-распределения, обеспечивающая устойчивую к распределительным предположениям меру точности. Эта оценка особенно полезна для сложных статистик.
Бутстрэп проверка гипотез
Подход к проверке гипотез, использующий бутстрэп для генерации распределения при нулевой гипотезе и вычисления p-значений непараметрическим способом. Этот метод избегает асимптотических приближений и работает со сложными тестовыми статистиками.
Бутстрэп выбор модели
Процесс выбора модели, использующий бутстрэп для оценки стабильности и сравнительной производительности различных моделей-кандидатов на множественных повторных выборках. Этот подход количественно определяет неопределенность в самом процессе выбора.
Бутстрэп анализ мощности
Оценка статистической мощности теста или модели путем симуляции множественных бутстрэп-выборок при различных гипотетических альтернативах. Этот метод позволяет оценить требуемый размер выборки без ограничительных распределительных предположений.
Бутстрэп калибровка
Техника корректировки вероятностей, предсказанных моделью классификации, с использованием бутстрэпа для оценки и исправления смещения калибровки. Этот метод улучшает надежность вероятностных оценок модели.
Бутстрэп ансамблевые методы
Семейство алгоритмов, сочетающих бутстрэп и агрегацию для уменьшения дисперсии предсказаний, включая случайный лес, экстра-деревья и другие методы, основанные на бутстрэп-выборках. Эти методы используют разнообразие, созданное повторным выбором.
Важность признаков с помощью бутстрэпа
Оценка важности переменных путем измерения их влияния на производительность модели через множественные бутстрэп-выборки, предоставляющая доверительные интервалы для важности. Этот подход количественно оценивает стабильность важности характеристик.
Стабильность модели с помощью бутстрэпа
Измерение устойчивости модели, оцениваемое по согласованности ее прогнозов или параметров через различные бутстрэп-выборки. Стабильность критически важна для доверия к реальным развертываниям модели.
Бутстрэп .632+
Продвинутый вариант бутстрэпа, который корректирует оптимистическое смещение оценки ошибки, комбинируя бутстрэп-ошибку и кажущуюся ошибку с весом 0.632, скорректированным для переобучения. Этот метод предоставляет более точные оценки ошибки.