Инфраструктура МО - Глоссарий ИИ

📖

термины

GPU (Графический процессор)

Процессор, изначально разработанный для визуализации графики, но его параллельная архитектура делает его чрезвычайно эффективным для ускорения матричных вычислений алгоритмов глубокого обучения.

📖

термины

TPU (Тензорный процессор)

Интегральная схема специального назначения (ASIC), разработанная Google, оптимизированная для ускорения операций умножения матриц и активаций нейронных сетей, особенно с фреймворком TensorFlow.

📖

термины

Экземпляры с прерыванием (Spot Instances)

Облачные вычислительные экземпляры со сниженной стоимостью, доступные по переменным тарифам и которые могут быть прерваны поставщиком, часто используются для задач обучения ML, допускающих прерывания.

📖

термины

Автомасштабирование

Способность инфраструктуры динамически изменять количество вычислительных ресурсов (серверов, подов) в зависимости от рабочей нагрузки для оптимизации затрат и производительности сервисов вывода.

📖

термины

Фреймворк для обслуживания моделей

Специализированный инструмент (например, TensorFlow Serving, TorchServe, Triton Inference Server), предназначенный для развертывания, обслуживания и эффективного управления моделями ML в продакшене, управляя версионированием и динамической загрузкой.

📖

термины

Гибридное облако

Архитектура, объединяющая общедоступные и частные (on-premise) облачные вычислительные ресурсы, позволяющая компаниям гибко управлять рабочими нагрузками ML в зависимости от требований безопасности, стоимости и производительности.

📖

термины

Оркестратор конвейеров ML

Система (например, Kubeflow Pipelines, Airflow, Prefect), которая определяет, выполняет, отслеживает и оркеструет сложные рабочие процессы ML, от подготовки данных до обучения и развертывания.

📖

термины

Квоты ресурсов

Механизм управления облачными/локальными ресурсами, ограничивающий количество CPU, GPU, памяти или хранилища, которое пользователь, проект или пространство имен может потреблять, что необходимо для управления затратами и обеспечения справедливости.

📖

термины

Холодный запуск

Начальная задержка, наблюдаемая при первом запросе к серверной службе вывода или свежезагруженной модели, из-за времени выделения ресурсов и загрузки модели в память.

Глоссарий ИИ

GPU (Графический процессор)

TPU (Тензорный процессор)

Экземпляры с прерыванием (Spot Instances)

Автомасштабирование

Фреймворк для обслуживания моделей

Гибридное облако

Оркестратор конвейеров ML

Квоты ресурсов

Холодный запуск

Результаты не найдены