KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Holdout Set
Sous-ensemble des données conservé séparément et non utilisé pendant l'entraînement du modèle pour évaluer objectivement ses performances finales. Cet ensemble reste totalement isolé jusqu'à l'évaluation finale pour éviter toute contamination de l'information.
Real-world Testing
Phase de validation où le modèle est déployé dans des conditions opérationnelles réelles pour évaluer ses performances dans leur contexte naturel d'utilisation. Ce testing révèle souvent des comportements inattendus non observés lors des validations en laboratoire.
Production Testing
Processus de validation continue des modèles après leur déploiement en production pour surveiller leurs performances et détecter toute dégradation. Cette étape est essentielle pour maintenir la fiabilité des systèmes IA dans un environnement opérationnel.
Shadow Mode Testing
Méthode de validation où un nouveau modèle s'exécute en parallèle du système de production sans affecter les décisions finales, permettant de comparer ses performances avec le modèle actuel. Cette approche minimise les risques lors de l'évaluation de nouvelles versions.
Temporal Validation
Stratégie de validation qui respecte l'ordre chronologique des données en utilisant uniquement les données passées pour l'entraînement et les données futures pour le test. Cette approche simule les conditions réelles de déploiement et évite la fuite d'information temporelle.
Geographic Validation
Validation externe où le modèle est testé sur des données provenant de régions géographiques différentes de celles utilisées pour l'entraînement. Cette technique est cruciale pour évaluer la capacité de généralisation spatiale des modèles.
Population Shift
Changement dans les caractéristiques démographiques ou statistiques de la population cible entre l'entraînement et le déploiement du modèle. Ce phénomène peut affecter significativement les performances et l'équité des prédictions.
Environmental Validation
Test du modèle dans des conditions environnementales variées (lumière, bruit, température) pour évaluer sa robustesse aux facteurs externes. Cette validation est particulièrement importante pour les systèmes de vision et les capteurs IoT.
Multi-site Validation
Évaluation des performances d'un modèle sur des données collectées depuis plusieurs sites ou institutions distincts pour tester sa généralisabilité. Cette approche est standard dans le domaine médical pour garantir la validité des modèles diagnostics.