Глоссарий ИИ
Полный словарь искусственного интеллекта
LASSO-регрессия
Метод регуляризации L1, который штрафует абсолютные значения коэффициентов признаков, заставляя некоторые коэффициенты стать нулевыми для автоматического отбора переменных.
Взаимная информация
Статистическая мера, количественно оценивающая зависимость между двумя переменными, используемая для оценки релевантности признаков по отношению к целевой переменной.
Критерий хи-квадрат
Статистический тест, оценивающий независимость между категориальными признаками и целевой переменной, используемый для фильтрации нерелевантных переменных.
Дисперсионный анализ (F-критерий)
Статистический метод, сравнивающий дисперсии между группами для оценки важности числовых признаков по отношению к категориальной целевой переменной.
Алгоритм Борута
Алгоритм отбора признаков на основе случайных лесов, который сравнивает важность реальных признаков со случайно сгенерированными теневыми признаками.
SelectKBest
Метод одномерного отбора, выбирающий k признаков с самыми высокими статистическими оценками в соответствии с заданным тестом (chi2, f_classif, mutual_info_classif).
Порог дисперсии
Базовая техника фильтрации, исключающая признаки, дисперсия которых ниже заданного порога, так как они считаются малоинформативными.
Последовательный отбор признаков
Жадный метод, который последовательно добавляет или удаляет признаки для оптимизации метрики производительности модели в соответствии со стратегией прямого или обратного отбора.
Генетический алгоритм для отбора признаков
Метаэвристический подход, использующий принципы естественного отбора для исследования пространства подмножеств признаков и поиска квазиоптимального решения.
Значения SHAP
Метод интерпретируемости, основанный на теории игр, который количественно оценивает влияние каждого признака на индивидуальные предсказания модели.
Отбор признаков на основе корреляции
Метод, оценивающий релевантность признаков путем анализа их корреляции с целевой переменной, одновременно минимизируя избыточность между признаками.
Информационный выигрыш
Мера, количественно оценивающая уменьшение энтропии целевой переменной при известном значении признака, используемая для оценки релевантности переменных.
Алгоритм Relief
Фильтрующий алгоритм отбора признаков, оценивающий релевантность переменных путем сравнения расстояний между похожими и непохожими экземплярами.
Автоматический отбор признаков
Автоматизированный процесс, объединяющий множество техник отбора для идентификации оптимального подмножества признаков без ручного вмешательства.
Встроенные методы
Подходы к отбору признаков, интегрированные непосредственно в процесс обучения модели, такие как деревья решений или методы регуляризации.
Методы-обёртки
Техники отбора, использующие модель машинного обучения для оценки качества подмножеств признаков посредством перекрестной проверки или метрик производительности.