Глоссарий ИИ
Полный словарь искусственного интеллекта
GPU (Графический процессор)
Процессор, изначально разработанный для визуализации графики, но его параллельная архитектура делает его чрезвычайно эффективным для ускорения матричных вычислений алгоритмов глубокого обучения.
TPU (Тензорный процессор)
Интегральная схема специального назначения (ASIC), разработанная Google, оптимизированная для ускорения операций умножения матриц и активаций нейронных сетей, особенно с фреймворком TensorFlow.
Экземпляры с прерыванием (Spot Instances)
Облачные вычислительные экземпляры со сниженной стоимостью, доступные по переменным тарифам и которые могут быть прерваны поставщиком, часто используются для задач обучения ML, допускающих прерывания.
Автомасштабирование
Способность инфраструктуры динамически изменять количество вычислительных ресурсов (серверов, подов) в зависимости от рабочей нагрузки для оптимизации затрат и производительности сервисов вывода.
Фреймворк для обслуживания моделей
Специализированный инструмент (например, TensorFlow Serving, TorchServe, Triton Inference Server), предназначенный для развертывания, обслуживания и эффективного управления моделями ML в продакшене, управляя версионированием и динамической загрузкой.
Гибридное облако
Архитектура, объединяющая общедоступные и частные (on-premise) облачные вычислительные ресурсы, позволяющая компаниям гибко управлять рабочими нагрузками ML в зависимости от требований безопасности, стоимости и производительности.
Оркестратор конвейеров ML
Система (например, Kubeflow Pipelines, Airflow, Prefect), которая определяет, выполняет, отслеживает и оркеструет сложные рабочие процессы ML, от подготовки данных до обучения и развертывания.
Квоты ресурсов
Механизм управления облачными/локальными ресурсами, ограничивающий количество CPU, GPU, памяти или хранилища, которое пользователь, проект или пространство имен может потреблять, что необходимо для управления затратами и обеспечения справедливости.
Холодный запуск
Начальная задержка, наблюдаемая при первом запросе к серверной службе вывода или свежезагруженной модели, из-за времени выделения ресурсов и загрузки модели в память.