Глоссарий ИИ
Полный словарь искусственного интеллекта
Feature Selection
Processus de sélection automatique des caractéristiques les plus pertinentes pour un modèle supervisé en éliminant les variables redondantes ou non informatives afin d'améliorer la performance et réduire la complexité.
Label Encoding
Transformation des variables catégorielles en valeurs numériques entières où chaque catégorie unique reçoit un identifiant numérique distinct, adapté pour les algorithmes nécessitant des entrées numériques.
Feature Scaling
Normalisation ou standardisation des caractéristiques numériques pour les ramener dans une plage comparable, essentielle pour les algorithmes sensibles à l'échelle des variables comme les SVM et les réseaux de neurones.
Polynomial Features
Génération de nouvelles caractéristiques par création de combinaisons polynomiales des variables existantes, permettant de capturer des relations non-linéaires entre les features et la variable cible.
Interaction Features
Création de nouvelles variables représentant les interactions entre caractéristiques existantes, typiquement par multiplication ou combinaison, pour révéler des effets synergiques dans les données supervisées.
Recursive Feature Elimination
Algorithme de sélection itérative qui construit un modèle, élimine les caractéristiques les moins importantes selon un critère spécifique, et répète ce processus jusqu'à atteindre le nombre optimal de features.
Target Encoding
Technique de transformation des variables catégorielles en utilisant des statistiques de la variable cible (moyenne, médiane) pour chaque catégorie, capturant ainsi directement la relation avec la prédiction.
Feature Importance
Mesure quantitative de l'impact de chaque caractéristique sur les prédictions du modèle supervisé, calculée par des méthodes comme permutation importance, SHAP values ou les coefficients du modèle.
Анализ главных компонентов
Техника линейного снижения размерности, которая преобразует характеристики в ортогональные некоррелирующие компоненты, максимизируя объясненную дисперсию с уменьшенным количеством измерений.
Биннинг/Дискретизация
Процесс преобразования непрерывных переменных в дискретные категории (бины) для упрощения отношений, обработки выбросов и улучшения производительности некоторых алгоритмов с учителем.
Хеширование признаков
Техника снижения размерности, которая применяет хеш-функцию к признакам для их отображения в пространство фиксированной размерности, полезная для данных высокой размерности с множеством категорий.
Восстановление пропущенных значений
Набор статистических или алгоритмических стратегий для замены пропущенных значений в признаках соответствующими оценками, что существенно для поддержания целостности данных с учителем.
Перекрестные признаки
Сочетание признаков для создания новых признаков, представляющих определенные взаимодействия, особенно эффективно в линейных моделях для захвата неаддитивных отношений.
Конвейер обработки признаков
Автоматизированная и воспроизводимая последовательность преобразований, применяемых к признакам, интегрирующая очистку, создание, отбор и масштабирование для обеспечения согласованности между обучением и предсказанием.
Создание признаков с учетом предметной области
Разработка признаков на основе экспертных знаний и знаний в предметной области, создающая информативные переменные, которые захватывают специфические шаблоны, неочевидные в исходных данных.
Инжиниринг временных признаков
Создание признаков, специфичных для временных данных, таких как лаговые признаки, скользящие статистики, временные компоненты и сезонные тренды для улучшения хронологических предсказаний с учителем.