Валидация и тестирование моделей МЛ

📂

подкатегории

Перекрестная проверка

Метод оценки, разделяющий данные на подмножества для проверки обобщающей способности модели на нескольких итерациях.

2 термины

📂

подкатегории

Статистические тесты

Формальные статистические методы для значимого сравнения производительности между различными моделями или конфигурациями.

15 термины

📂

подкатегории

Метрики производительности

Набор количественных показателей (точность, полнота, F1-score, MAE, RMSE), измеряющих качество прогнозов в зависимости от контекста.

9 термины

📂

подкатегории

Анализ смещения и дисперсии

Разложение ошибки обобщения на смещение (недообучение) и дисперсию (переобучение) для оптимизации сложности модели.

13 термины

📂

подкатегории

Тесты на устойчивость

Оценка стабильности прогнозов при наличии возмущений, шума и вариаций во входных данных.

13 термины

📂

подкатегории

Временная проверка

Методология, специфичная для последовательных данных, где обучение использует периоды, предшествующие тестированию, для симуляции реальных условий.

10 термины

📂

подкатегории

ROC-кривые и AUC

Графические инструменты и метрики для оценки производительности бинарных классификаторов при различных пороговых значениях.

3 термины

📂

подкатегории

Калибровка Моделей

Корректировка предсказанных вероятностей для точного отражения реальных частот возникновения событий.

6 термины

📂

подкатегории

Тесты на справедливость

Оценка демографических предвзятостей и потенциальной дискриминации модели в соответствии с этическими и регуляторными критериями.

10 термины

📂

подкатегории

Анализ ошибок

Систематический анализ неверных прогнозов для выявления моделей ошибок и руководства улучшением модели.

9 термины

📂

подкатегории

Bootstrap-валидация

Техника повторной выборки с заменой для оценки изменчивости и надежности метрик производительности.

9 термины

📂

подкатегории

Стресс-тесты

Оценка поведения модели в экстремальных условиях или граничных случаях для определения ее операционных ограничений.

16 термины

📂

подкатегории

Тесты на чувствительность

Анализ влияния вариаций входных характеристик на прогнозы для понимания стабильности модели.

13 термины

📂

подкатегории

Внешняя валидация

Тестирование модели на данных из совершенно новых источников или распределений для оценки её способности к обобщению.

9 термины

📂

подкатегории

Тесты деградации

Непрерывный мониторинг производительности модели в эксплуатации для обнаружения дрейфа данных и временной деградации.

7 термины

Глоссарий ИИ

Перекрестная проверка

Статистические тесты

Метрики производительности

Анализ смещения и дисперсии

Тесты на устойчивость

Временная проверка

ROC-кривые и AUC

Калибровка Моделей

Тесты на справедливость

Анализ ошибок

Bootstrap-валидация

Стресс-тесты

Тесты на чувствительность

Внешняя валидация

Тесты деградации

Результаты не найдены