Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
A/B Testing
Méthodologie expérimentale comparant deux versions (A et B) d'un modèle ou service pour déterminer laquelle performe mieux selon des métriques prédéfinies, généralement via une répartition aléatoire du trafic.
Multivariate Testing
Technique avancée testant simultanément plusieurs variables et leurs combinaisons pour identifier l'optimisation globale, permettant d'évaluer l'interaction entre différents facteurs du modèle.
Blue-Green Deployment
Pattern de déploiement avec deux environnements identiques où le trafic bascule entièrement de l'ancienne version (Blue) à la nouvelle (Green) après validation complète, minimisant le temps d'arrêt.
Feature Flag
Mécanisme de contrôle permettant d'activer/désactiver dynamiquement des fonctionnalités ou modèles spécifiques sans redéploiement, facilitant les expériences et les rollbacks rapides.
Traffic Splitting
Technique de routage intelligent répartissant proportionnellement les requêtes entre différentes versions de modèles selon des règles configurables pour les tests A/B ou déploiements progressifs.
Statistical Significance
Mesure probabiliste déterminant si les différences observées entre les variantes testées sont dues à des effets réels plutôt qu'au hasard, généralement avec un seuil de p-value < 0.05.
P-value
Probabilité d'observer des résultats au moins aussi extrêmes que ceux mesurés si l'hypothèse nulle était vraie, servant de critère décisionnel dans les tests d'hypothèses.
Confidence Interval
Plage de valeurs estimées contenant avec une probabilité définie (typiquement 95%) la vraie valeur du paramètre mesuré, quantifiant l'incertitude des estimations expérimentales.
Control Group
Échantillon de population recevant la version de référence (généralement le modèle actuel) servant de baseline pour comparaison statistique avec les variantes expérimentales.
Treatment Group
Segment de population exposé à la variante expérimentale du modèle ou traitement testé, permettant de mesurer l'impact relatif par rapport au groupe de contrôle.
Baseline Model
Modèle de référence utilisé comme point de comparaison pour évaluer les améliorations apportées par de nouvelles versions, souvent le modèle actuellement en production.
Champion-Challenger
Stratégie de compétition continue où le modèle champion actuel est constamment défié par des modèles challengers, le meilleur performer remplaçant progressivement le champion.
Progressive Rollout
Déploiement incrémental d'un nouveau modèle avec augmentation graduelle du pourcentage de trafic, permettant une validation continue et une minimisation des risques d'impact négatif.
Experimentation Platform
Infrastructure centralisée gérant le cycle de vie complet des expérimentations, de la création des variantes à l'analyse statistique des résultats et l'automatisation des décisions.
Metric Drift
Phénomène de dégradation progressive des métriques de performance d'un modèle en production, détecté via le monitoring continu et nécessitant des réévaluations périodiques.
Sample Size Calculation
Processus statistique déterminant le nombre minimum d'observations requis pour détecter une différence significative avec une puissance statistique donnée, essentiel pour la planification des tests.
Bayesian A/B Testing
Approche alternative utilisant les probabilités bayésiennes pour évaluer les variantes, permettant des décisions continues avec des échantillons plus petits et une interprétation intuitive des résultats.
Sequential Testing
Méthodologie d'analyse permettant l'évaluation des résultats à des intervalles prédéfinis sans inflation du risque d'erreur de type I, optimisant la durée et les coûts des expérimentations.