Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Model Versioning
Système de gestion des versions de modèles machine learning permettant de suivre les itérations, comparer les performances et revenir à des versions antérieures en cas de régression.
Data Version Control (DVC)
Outil open source qui étend Git pour gérer le versioning de datasets et modèles volumineux, en stockant les métadonnées dans Git et les fichiers binaires dans des storage clouds.
Git LFS
Git Large File Storage, extension de Git permettant de versionner des fichiers volumineux comme les datasets et modèles en les stockant séparément du repository Git principal.
Experiment Tracking
Processus systématique d'enregistrement des hyperparamètres, métriques, artefacts et résultats des expériences ML pour assurer la traçabilité et la reproductibilité.
Model Registry
Système centralisé de stockage et gestion des versions de modèles ML avec leurs métadonnées, statuts de déploiement et historique de performance.
Reproducibility
Capacité de recréer exactement les mêmes résultats d'une expérience ML en utilisant les mêmes données, code, paramètres et environnement d'exécution.
Artifact Repository
Système de stockage versionné pour les artefacts ML incluant les modèles entraînés, datasets prétraités, et autres fichiers binaires avec gestion des métadonnées.
Model Drift Detection
Processus de surveillance continue des performances et distributions de données pour identifier la dégradation des modèles due aux changements dans les patterns de données.
Continuous Integration for ML (CI/ML)
Automatisation des tests de validation de code, données et modèles à chaque commit pour garantir la qualité et la cohérence dans le pipeline ML.
Continuous Training
Automatisation du réentraînement périodique des modèles avec de nouvelles données pour maintenir leur pertinence face à l'évolution des patterns de données.
Model Monitoring
Surveillance continue en production des prédictions, performances et distributions d'entrée pour détecter les anomalies et garantir le bon fonctionnement des modèles.
Data Provenance
Documentation complète de l'origine, l'historique et les transformations des données utilisées dans les pipelines ML, essentielle pour l'audit et la conformité.
Semantic Versioning
Convention de numérotation (X.Y.Z) pour les versions de modèles où X indique des changements majeurs, Y des ajouts de features, et Z des corrections mineures.
Lakehouse Architecture
Architecture hybride combinant la flexibilité des data lakes avec la gestion structurée des data warehouses pour optimiser le versioning et l'analyse de données ML.
Model Baseline
Modèle de référence ou version initiale utilisée comme point de comparaison pour évaluer les améliorations ou détecter les régressions dans les nouvelles versions.