Глоссарий ИИ
Полный словарь искусственного интеллекта
Отложенная выборка
Подмножество данных, которое хранится отдельно и не используется во время обучения модели для объективной оценки ее итоговой производительности. Этот набор остается полностью изолированным до финальной оценки, чтобы избежать любой утечки информации.
Тестирование в реальных условиях
Этап валидации, на котором модель развертывается в реальных рабочих условиях для оценки ее производительности в естественном контексте использования. Такое тестирование часто выявляет непредвиденное поведение, не наблюдаемое при лабораторных проверках.
Продукционное тестирование
Процесс непрерывной проверки моделей после их развертывания в продакшене для мониторинга их производительности и обнаружения любых ухудшений. Этот этап необходим для поддержания надежности систем ИИ в рабочей среде.
Тестирование в теневом режиме
Метод валидации, при котором новая модель работает параллельно с производственной системой, не влияя на окончательные решения, что позволяет сравнить ее производительность с текущей моделью. Этот подход минимизирует риски при оценке новых версий.
Временная валидация
Стратегия валидации, которая соблюдает хронологический порядок данных, используя только прошлые данные для обучения и будущие данные для тестирования. Этот подход имитирует реальные условия развертывания и предотвращает временную утечку информации.
Географическая валидация
Внешняя валидация, при которой модель тестируется на данных из географических регионов, отличных от тех, что использовались для обучения. Эта техника имеет решающее значение для оценки пространственной способности к обобщению моделей.
Сдвиг популяции
Изменение демографических или статистических характеристик целевой популяции между обучением и развертыванием модели. Это явление может значительно повлиять на производительность и справедливость предсказаний.
Экологическая валидация
Тестирование модели в различных условиях окружающей среды (освещение, шум, температура) для оценки ее устойчивости к внешним факторам. Такая валидация особенно важна для систем компьютерного зрения и датчиков IoT.
Многосайтовая валидация
Оценка производительности модели на данных, собранных с нескольких сайтов или различных учреждений для проверки ее обобщаемости. Этот подход является стандартным в медицинской области для обеспечения достоверности диагностических моделей.