Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Missing Completely At Random (MCAR)
Mécanisme où la probabilité qu'une observation soit manquante ne dépend ni des données observées ni des données manquantes. Les données manquantes représentent un sous-ensemble aléatoire simple de l'ensemble de données complet.
Missing At Random (MAR)
Mécanisme où la probabilité de données manquantes dépend uniquement des valeurs observées mais pas des valeurs manquantes elles-mêmes. Ce pattern permet une correction par imputation conditionnelle aux variables observées.
Missing Not At Random (MNAR)
Mécanisme où la probabilité de données manquantes dépend directement des valeurs manquantes elles-mêmes. Les méthodes d'imputation standard peuvent introduire un biais significatif dans ce cas.
Little's MCAR Test
Test statistique d'hypothèse nulle que les données manquent complètement aléatoirement (MCAR). Basé sur la comparaison des moyennes et covariances entre les cas complets et incomplets.
Pattern Matrix
Matrice binaire indiquant la présence (1) ou l'absence (0) de données pour chaque observation et variable. Permet d'identifier visuellement les structures de données manquantes complexes.
Missing Data Mechanism
Processus sous-jacent qui génère les données manquantes dans un ensemble de données. Comprend trois mécanismes principaux : MCAR, MAR et MNAR, chacun nécessitant des approches de traitement différentes.
Complete Case Analysis
Méthode d'analyse utilisant uniquement les observations sans aucune valeur manquante. Simple à implémenter mais peut entraîner une perte importante de données et des biais si MCAR n'est pas vérifié.
Available Case Analysis
Approche utilisant toutes les données disponibles pour chaque calcul statistique, permettant différentes tailles d'échantillon selon les variables. Inclut les méthodes de pairwise et listwise deletion.
Monotone Missing Pattern
Structure où si une variable est manquante pour une observation, toutes les variables suivantes dans un ordre prédéfini sont également manquantes. Simplifie grandement les méthodes d'imputation multiple.
Missingness Correlation
Mesure de l'association entre les patterns de données manquantes de différentes variables. Une forte corrélation peut indiquer un mécanisme MAR ou suggérer des relations structurelles dans les données.
Missing Data Visualization
Ensemble de techniques graphiques (heatmaps, barplots, patterns plots) pour explorer et communiquer la structure et l'étendue des données manquantes. Essentiel pour le diagnostic préliminaire.
Response Rate Analysis
Évaluation systématique des taux de réponse par variable, par groupe ou dans le temps. Permet d'identifier les facteurs associés à la non-réponse et de détecter les biais potentiels.
Missing Data Diagnostics
Processus complet d'évaluation des caractéristiques, patterns et mécanismes des données manquantes avant imputation. Combine analyses statistiques et visualisations pour guider le traitement approprié.
Arbitrary Missing Pattern
Structure de données manquantes sans organisation particulière où les absences peuvent survenir n'importe où dans le dataset. Requiert des méthodes d'imputation plus sophistiquées comme MICE.
Missing Data Profile
Rapport synthétique décrivant la distribution, les patterns et les caractéristiques des données manquantes. Inclut des statistiques descriptives et des visualisations pour l'évaluation globale.