Глоссарий ИИ
Полный словарь искусственного интеллекта
Test de Régression Modèle
Procédure automatisée vérifiant qu'un nouveau modèle ou une nouvelle version de pipeline ne dégrade pas les performances par rapport à une version de référence sur un jeu de données de test fixe.
Validation de Dérive de Données (Data Drift Validation)
Test automatisé qui compare la distribution statistique des nouvelles données de production à celle des données d'entraînement pour détecter des changements significatifs pouvant impacter la performance du modèle.
Test de Biais (Bias Testing)
Ensemble d'automates mesurant et quantifiant les préjugés systématiques d'un modèle à l'égard de sous-groupes démographiques spécifiques pour garantir l'équité et l'éthique algorithmique.
Test de Conformité (Compliance Testing)
Vérification automatisée qu'un modèle et ses données respectent les réglementations et standards en vigueur, tels que le RGPD pour la protection des données personnelles.
Test de Performance de Latence
Mesure automatisée du temps de réponse d'un modèle en conditions de charge, garantissant qu'il respecte les exigences de temps réel pour une application en production.
Validation de la Cohérence des Features
Test automatisé qui s'assure que les caractéristiques (features) calculées par le pipeline respectent les contraintes de schéma, de type et de plage de valeurs attendues par le modèle.
Test de Stabilité du Pipeline
Validation automatisée de l'ensemble des étapes d'un pipeline ML (prétraitement, entraînement, inférence) pour s'assurer qu'il s'exécute de manière déterministe et sans erreurs.
Test de Sécurité Adversarial
Évaluation automatisée de la vulnérabilité d'un modèle à des attaques par exemples contradictoires (adversarial examples), conçus pour induire des prédictions erronées.
Тест на монотонность
Автоматическая проверка для моделей, где ожидается монотонная зависимость между признаком и предсказанием, обеспечивающая, что увеличение признака действительно приводит к растущему (или убывающему) предсказанию.
Валидация качества данных (Data Quality Validation)
Набор автоматизированных тестов, проверяющих полноту, уникальность, допустимость и согласованность необработанных данных перед их загрузкой в конвейер обучения или вывода.
Тест на деградацию метрик
Непрерывный мониторинг, который запускает оповещение, если метрики производительности модели (например, F1-score, AUC) падают ниже предопределенного порога на производственных данных.
Тест интеграции модели
Автоматизированная валидация корректного взаимодействия между обученной моделью и другими компонентами системы, такими как API, базы данных и сервисы мониторинга.
Теневое тестирование (Shadow Testing)
Техника, при которой новая модель разворачивается параллельно с производственной моделью, получая тот же реальный трафик, но не влияя на пользователей, для сравнения их производительности перед переключением.
Тест репликации эксперимента
Автоматизация, которая проверяет воспроизводимость результатов обучения, выполняя тот же конвейер с фиксированными случайными seedами, обеспечивая минимальные и контролируемые вариации.
Канареечное тестирование для ML-моделей (Canary Testing)
Стратегия развертывания, при которой новая версия модели предоставляется малому проценту пользовательского трафика в продакшене, позволяя валидацию в реальных условиях перед полным развертыванием.
Тест зависимостей конвейера
Автоматизированная валидация того, что все библиотеки, версии программного обеспечения и внешние ресурсы, необходимые для ML-конвейера, присутствуют и совместимы в целевой среде выполнения.