A/B 测试与实验 - AI 詞彙表

Échantillon de population recevant la version de référence (généralement le modèle actuel) servant de baseline pour comparaison statistique avec les variantes expérimentales.

📖

術語

Treatment Group

Segment de population exposé à la variante expérimentale du modèle ou traitement testé, permettant de mesurer l'impact relatif par rapport au groupe de contrôle.

📖

術語

Baseline Model

Modèle de référence utilisé comme point de comparaison pour évaluer les améliorations apportées par de nouvelles versions, souvent le modèle actuellement en production.

📖

術語

Champion-Challenger

Stratégie de compétition continue où le modèle champion actuel est constamment défié par des modèles challengers, le meilleur performer remplaçant progressivement le champion.

📖

術語

Progressive Rollout

Déploiement incrémental d'un nouveau modèle avec augmentation graduelle du pourcentage de trafic, permettant une validation continue et une minimisation des risques d'impact négatif.

📖

術語

Experimentation Platform

Infrastructure centralisée gérant le cycle de vie complet des expérimentations, de la création des variantes à l'analyse statistique des résultats et l'automatisation des décisions.

📖

術語

Metric Drift

Phénomène de dégradation progressive des métriques de performance d'un modèle en production, détecté via le monitoring continu et nécessitant des réévaluations périodiques.

📖

術語

Sample Size Calculation

Processus statistique déterminant le nombre minimum d'observations requis pour détecter une différence significative avec une puissance statistique donnée, essentiel pour la planification des tests.

📖

術語

贝叶斯 A/B 测试

一种使用贝叶斯概率来评估变体的替代方法，允许在样本量更小的情况下进行持续决策，并对结果提供直观的解释。

📖

術語

序贯测试

一种分析方法，允许在预定的时间间隔评估结果，而不会增加 I 类错误的风险，从而优化实验的持续时间和成本。

AI 詞彙表

A/B测试

多变量测试

蓝绿部署

功能标志

流量分割

统计显著性

P值

置信区间

Control Group