Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Transformation de Variables Numériques
Application de transformations mathématiques aux variables continues pour améliorer leur distribution et relation avec la cible.
Encodage de Variables Catégorielles
Conversion des données textuelles ou catégorielles en format numérique exploitable par les algorithmes de machine learning.
Gestion des Valeurs Manquantes
Techniques d'imputation et de traitement des données absentes pour maintenir l'intégrité du jeu de données.
Création de Caractéristiques Temporelles
Extraction et génération de variables basées sur le temps à partir de données temporelles ou séquentielles.
Extraction de Caractéristiques Textuelles
Transformation du texte non structuré en vecteurs numériques via techniques comme TF-IDF, embeddings et n-grammes.
Ingénierie Géospatiale
Création de variables à partir de données de localisation et coordonnées géographiques pour capturer les relations spatiales.
Normalisation et Standardisation
Mise à l'échelle des variables pour comparabilité et convergence optimale des algorithmes d'apprentissage.
Sélection de Caractéristiques
Identification et conservation des variables les plus pertinentes pour améliorer la performance et réduire la complexité.
Réduction de Dimensionnalité
Techniques comme PCA et t-SNE pour compresser l'information tout préservant les variations importantes.
Création d'Interactions
Génération de nouvelles caractéristiques par combinaison multiplicative ou additive entre variables existantes.
Transformation de Distributions
Application de transformations logarithmiques, Box-Cox ou Yeo-Johnson pour normaliser les distributions asymétriques.
Extraction de Caractéristiques d'Images
Conversion de données visuelles en descripteurs numériques via histogrammes, textures et descripteurs locaux.
Ingénierie de Caractéristiques Audio
Extraction de caractéristiques spectrales et temporelles comme MFCC, chroma et spectrogrammes à partir de signaux audio.
Agrégation Temporelle
Création de statistiques roulantes et agrégats sur des fenêtres temporelles pour capturer les tendances et patterns.
Caractéristiques Polynomiales
Génération de termes d'ordre supérieur pour capturer les relations non-linéaires entre variables.
Binning et Discrétisation
Division des variables continues en intervalles discrets pour capturer les effets non-linéaires et réduire le bruit.
Ingénierie pour Séries Temporelles
Création de lag features, moyennes mobiles et décompositions saisonnières pour modéliser les dépendances temporelles.
Extraction de Caractéristiques de Graphes
Génération de descripteurs à partir de structures de réseaux comme centralité, clustering et embeddings de nœuds.