Автоматический выбор признаков

📖

термины

LASSO-регрессия

Метод регуляризации L1, который штрафует абсолютные значения коэффициентов признаков, заставляя некоторые коэффициенты стать нулевыми для автоматического отбора переменных.

📖

термины

Взаимная информация

Статистическая мера, количественно оценивающая зависимость между двумя переменными, используемая для оценки релевантности признаков по отношению к целевой переменной.

📖

термины

Критерий хи-квадрат

Статистический тест, оценивающий независимость между категориальными признаками и целевой переменной, используемый для фильтрации нерелевантных переменных.

📖

термины

Дисперсионный анализ (F-критерий)

Статистический метод, сравнивающий дисперсии между группами для оценки важности числовых признаков по отношению к категориальной целевой переменной.

📖

термины

Алгоритм Борута

Алгоритм отбора признаков на основе случайных лесов, который сравнивает важность реальных признаков со случайно сгенерированными теневыми признаками.

📖

термины

SelectKBest

Метод одномерного отбора, выбирающий k признаков с самыми высокими статистическими оценками в соответствии с заданным тестом (chi2, f_classif, mutual_info_classif).

📖

термины

Порог дисперсии

Базовая техника фильтрации, исключающая признаки, дисперсия которых ниже заданного порога, так как они считаются малоинформативными.

📖

термины

Последовательный отбор признаков

Жадный метод, который последовательно добавляет или удаляет признаки для оптимизации метрики производительности модели в соответствии со стратегией прямого или обратного отбора.

📖

термины

Генетический алгоритм для отбора признаков

Метаэвристический подход, использующий принципы естественного отбора для исследования пространства подмножеств признаков и поиска квазиоптимального решения.

📖

термины

Значения SHAP

Метод интерпретируемости, основанный на теории игр, который количественно оценивает влияние каждого признака на индивидуальные предсказания модели.

📖

термины

Отбор признаков на основе корреляции

Метод, оценивающий релевантность признаков путем анализа их корреляции с целевой переменной, одновременно минимизируя избыточность между признаками.

📖

термины

Информационный выигрыш

Мера, количественно оценивающая уменьшение энтропии целевой переменной при известном значении признака, используемая для оценки релевантности переменных.

📖

термины

Алгоритм Relief

Фильтрующий алгоритм отбора признаков, оценивающий релевантность переменных путем сравнения расстояний между похожими и непохожими экземплярами.

📖

термины

Автоматический отбор признаков

Автоматизированный процесс, объединяющий множество техник отбора для идентификации оптимального подмножества признаков без ручного вмешательства.

📖

термины

Встроенные методы

Подходы к отбору признаков, интегрированные непосредственно в процесс обучения модели, такие как деревья решений или методы регуляризации.

📖

термины

Методы-обёртки

Техники отбора, использующие модель машинного обучения для оценки качества подмножеств признаков посредством перекрестной проверки или метрик производительности.

Глоссарий ИИ

LASSO-регрессия

Взаимная информация

Критерий хи-квадрат

Дисперсионный анализ (F-критерий)

Алгоритм Борута

SelectKBest

Порог дисперсии

Последовательный отбор признаков

Генетический алгоритм для отбора признаков

Значения SHAP

Отбор признаков на основе корреляции

Информационный выигрыш

Алгоритм Relief

Автоматический отбор признаков

Встроенные методы

Методы-обёртки

Результаты не найдены