Встроенный AutoML и Edge - Глоссарий ИИ

📖

термины

AutoML для встраиваемых систем

Подобласть AutoML, специализирующаяся на автоматической генерации оптимизированных моделей для специфических ограничений встраиваемых устройств, включая ограниченную память, низкую вычислительную мощность и энергетические ограничения.

📖

термины

Квантование модели

Техника оптимизации, которая снижает числовую точность весов и активаций нейронной сети (обычно с 32-бит до 8-бит или меньше) для уменьшения размера модели и ускорения вывода на ограниченном оборудовании.

📖

термины

Нейронное прореживание

Процесс выборочного удаления избыточных весов или нейронов в нейронной сети для снижения её вычислительной сложности и размера памяти с сохранением точности.

📖

термины

Дистилляция знаний

Метод трансферного обучения, при котором большая модель-учитель обучает более компактную модель-студента, позволяя сохранить производительность большой модели в архитектуре, адаптированной для периферийных устройств (Edge).

📖

термины

Оптимизация вывода (инференса)

Набор техник, направленных на сокращение времени и ресурсов, необходимых для выполнения обученной модели, включая слияние операций, эффективное распределение памяти и использование аппаратного параллелизма.

📖

термины

NAS для Edge

Ограниченный поиск архитектуры нейронной сети, который автоматически оптимизирует структуры сетей с учётом конкретных аппаратных ограничений периферийных устройств, таких как целевая задержка и энергопотребление.

📖

термины

Компилятор модели

Инструмент, который преобразует графы вычислений ИИ в оптимизированный машинный код для конкретных целевых архитектур, интегрируя такие оптимизации, как квантование и слияние операций.

📖

термины

TensorRT

SDK для оптимизации и выполнения от NVIDIA, предназначенный для развёртывания моделей ИИ в производственной среде, использующий квантование, слияние слоёв и оптимизацию ядер для максимизации производительности на GPU NVIDIA.

📖

термины

TinyML

Область машинного обучения, сфокусированная на выполнении моделей ИИ на микроконтроллерах и устройствах с ультранизким энергопотреблением, как правило, с менее чем 1 МБ памяти и работающих при мощности менее 1 мВт.

📖

термины

Edge TPU

Аппаратный ускоритель на базе ASIC, разработанный Google специально для вывода ИИ на периферии, оптимизированный для выполнения квантованных моделей TensorFlow Lite с высокой энергоэффективностью.

📖

термины

Optimisation de la mémoire

Техники уменьшения следа моделей в памяти, включая разделение весов, сжатие и динамическое выделение для соответствия ограничениям встраиваемых устройств.

📖

термины

Latence d'inférence

Время, прошедшее между вводом данных в модель и получением её предсказания, критический параметр в приложениях реального времени на периферии, где целевые типичные значения составляют менее 10 мс.

📖

термины

Modèle allégé

Архитектура нейронной сети, специально разработанная для минимизации параметров и вычислительных операций, такая как MobileNet или EfficientNet, оптимизированная для развертывания на мобильных устройствах и на периферии.

📖

термины

Déploiement distribué

Стратегия распределения рабочих нагрузок ИИ между несколькими устройствами на периферии для оптимизации общих ресурсов и повышения масштабируемости распределенных ИИ-приложений.

📖

термины

Optimisation énergétique

Процесс минимизации энергопотребления моделей ИИ на устройствах на периферии, критически важный для приложений с батарейным питанием и развертываний в большом масштабе.

📖

термины

Edge AI

Парадигма обработки искусственного интеллекта непосредственно на периферийных устройствах, устраняющая необходимость обмена данными с облаком для критически важных задач вывода.

📖

термины

Микроконтроллер с ИИ

Система на кристалле сверхнизкого энергопотребления, интегрирующая специализированные аппаратные ускорители для вывода ИИ, позволяющая выполнять модели TinyML при потреблении всего несколько микроватт.

📖

термины

Оптимизация с учётом аппаратных особенностей

Подход AutoML, который интегрирует специфические характеристики целевого оборудования в процесс автоматического проектирования моделей, обеспечивая оптимальную совместимость и производительность.

📖

термины

Слияние операций

Техника компиляции, которая объединяет несколько смежных слоёв или операций в одну операцию ядра, уменьшая накладные расходы памяти и повышая вычислительную эффективность на граничных устройствах (Edge).

Глоссарий ИИ

AutoML для встраиваемых систем

Квантование модели

Нейронное прореживание

Дистилляция знаний

Оптимизация вывода (инференса)

NAS для Edge

Компилятор модели

TensorRT

TinyML

Edge TPU

Optimisation de la mémoire

Latence d'inférence

Modèle allégé

Déploiement distribué

Optimisation énergétique

Edge AI

Микроконтроллер с ИИ

Оптимизация с учётом аппаратных особенностей

Слияние операций

Результаты не найдены