Глоссарий ИИ
Полный словарь искусственного интеллекта
A/B тестирование моделей
Техника сравнительного развертывания, при которой две версии модели тестируются одновременно на различных сегментах пользователей для оценки их относительной производительности в реальных условиях.
Онлайн-вывод
Режим вывода в реальном времени, при котором модель обрабатывает индивидуальные предсказания по запросу с минимальной задержкой, обычно через REST API или gRPC.
Пакетный вывод
Подход вывода, при котором предсказания генерируются для пакетов данных через регулярные интервалы, оптимизированный для пропускной способности, а не для индивидуальной задержки.
Бессерверный вывод
Архитектура развертывания, при которой вычислительная инфраструктура автоматически управляется облачным провайдером с оплатой по использованию и автоматическим масштабированием на основе спроса.
Развертывание Edge AI
Развертывание моделей ML на периферийных устройствах для локального выполнения вывода, снижая задержку и зависимость от сети, обеспечивая при этом конфиденциальность данных.
Обслуживание моделей
Инфраструктура и процессы, позволяющие предоставлять модели ML через API endpoints для вывода в производственной среде, включая загрузку, управление жизненным циклом и оптимизацию.
Автомасштабирование для ML
Механизм динамической адаптации вычислительных ресурсов в зависимости от нагрузки вывода, использующий специфические метрики, такие как количество запросов или задержка.
Наблюдаемость моделей
Возможность понимать внутреннее состояние и поведение моделей в производственной среде благодаря подробным логам, метрикам и трассировкам для отладки и оптимизации.
Gradual Rollout
Стратегия контролируемого развертывания, при которой охват новой моделью постепенно увеличивается (10%, 25%, 50%, 100%) с валидацией на каждом этапе.
Model Serialization
Процесс преобразования обученной модели в сохраняемый и переносимый формат (Pickle, ONNX, SavedModel) для развертывания и вывода в production.
Inference Pipeline
Последовательность этапов обработки, применяемых к входным данным до и после предсказания моделью, включая предобработку, вывод и постобработку.