Супервизионное конструирование признаков

📖

термины

Feature Selection

Processus de sélection automatique des caractéristiques les plus pertinentes pour un modèle supervisé en éliminant les variables redondantes ou non informatives afin d'améliorer la performance et réduire la complexité.

📖

термины

Label Encoding

Transformation des variables catégorielles en valeurs numériques entières où chaque catégorie unique reçoit un identifiant numérique distinct, adapté pour les algorithmes nécessitant des entrées numériques.

📖

термины

Feature Scaling

Normalisation ou standardisation des caractéristiques numériques pour les ramener dans une plage comparable, essentielle pour les algorithmes sensibles à l'échelle des variables comme les SVM et les réseaux de neurones.

📖

термины

Polynomial Features

Génération de nouvelles caractéristiques par création de combinaisons polynomiales des variables existantes, permettant de capturer des relations non-linéaires entre les features et la variable cible.

📖

термины

Interaction Features

Création de nouvelles variables représentant les interactions entre caractéristiques existantes, typiquement par multiplication ou combinaison, pour révéler des effets synergiques dans les données supervisées.

📖

термины

Recursive Feature Elimination

Algorithme de sélection itérative qui construit un modèle, élimine les caractéristiques les moins importantes selon un critère spécifique, et répète ce processus jusqu'à atteindre le nombre optimal de features.

📖

термины

Target Encoding

Technique de transformation des variables catégorielles en utilisant des statistiques de la variable cible (moyenne, médiane) pour chaque catégorie, capturant ainsi directement la relation avec la prédiction.

📖

термины

Feature Importance

Mesure quantitative de l'impact de chaque caractéristique sur les prédictions du modèle supervisé, calculée par des méthodes comme permutation importance, SHAP values ou les coefficients du modèle.

📖

термины

Анализ главных компонентов

Техника линейного снижения размерности, которая преобразует характеристики в ортогональные некоррелирующие компоненты, максимизируя объясненную дисперсию с уменьшенным количеством измерений.

📖

термины

Биннинг/Дискретизация

Процесс преобразования непрерывных переменных в дискретные категории (бины) для упрощения отношений, обработки выбросов и улучшения производительности некоторых алгоритмов с учителем.

📖

термины

Хеширование признаков

Техника снижения размерности, которая применяет хеш-функцию к признакам для их отображения в пространство фиксированной размерности, полезная для данных высокой размерности с множеством категорий.

📖

термины

Восстановление пропущенных значений

Набор статистических или алгоритмических стратегий для замены пропущенных значений в признаках соответствующими оценками, что существенно для поддержания целостности данных с учителем.

📖

термины

Перекрестные признаки

Сочетание признаков для создания новых признаков, представляющих определенные взаимодействия, особенно эффективно в линейных моделях для захвата неаддитивных отношений.

📖

термины

Конвейер обработки признаков

Автоматизированная и воспроизводимая последовательность преобразований, применяемых к признакам, интегрирующая очистку, создание, отбор и масштабирование для обеспечения согласованности между обучением и предсказанием.

📖

термины

Создание признаков с учетом предметной области

Разработка признаков на основе экспертных знаний и знаний в предметной области, создающая информативные переменные, которые захватывают специфические шаблоны, неочевидные в исходных данных.

📖

термины

Инжиниринг временных признаков

Создание признаков, специфичных для временных данных, таких как лаговые признаки, скользящие статистики, временные компоненты и сезонные тренды для улучшения хронологических предсказаний с учителем.

Глоссарий ИИ

Feature Selection

Label Encoding

Feature Scaling

Polynomial Features

Interaction Features

Recursive Feature Elimination

Target Encoding

Feature Importance

Анализ главных компонентов

Биннинг/Дискретизация

Хеширование признаков

Восстановление пропущенных значений

Перекрестные признаки

Конвейер обработки признаков

Создание признаков с учетом предметной области

Инжиниринг временных признаков

Результаты не найдены