Оптимизация моделей для Edge

📖

термины

Бинарные нейронные сети

Нейронные сети, веса и активации которых ограничены бинарными значениями (+1/-1), обеспечивающие экстремальное сжатие и значительное ускорение инференса.

📖

термины

Структурированное прореживание

Техника прореживания, удаляющая целые структуры, такие как фильтры, каналы или полные слои, что позволяет получить реальный выигрыш в производительности, в отличие от неструктурированного прореживания.

📖

термины

Динамические вычисления

Стратегия, адаптирующая вычислительную сложность модели в зависимости от входных данных или ограничений ресурсов, оптимизирующая энергопотребление и задержку на периферийных устройствах.

📖

термины

Оптимизация TensorRT

Набор оптимизаций от NVIDIA, включающий слияние слоев, калибровку точности и авто-настройку для максимизации производительности инференса на периферийных GPU.

📖

термины

TinyML

Область машинного обучения, направленная на развертывание ультракомпактных моделей ИИ (<1 МБ) на микроконтроллерах с крайне ограниченными ресурсами (ОЗУ <256 КБ).

📖

термины

ONNX Runtime

Кроссплатформенный движок инференса, оптимизирующий выполнение моделей в формате ONNX на различных аппаратных архитектурах, включая периферийные устройства и IoT.

📖

термины

Пост-обучающая квантизация

Техника квантизации, применяемая после полного обучения модели, использующая небольшой калибровочный набор данных для определения оптимальных параметров квантизации.

📖

термины

Разреженные нейронные сети

Нейронные сети, содержащие большую долю нулевых или близких к нулю весов, что позволяет добиться значительных вычислительных и存储 оптимизаций на периферийных платформах.

📖

термины

Слияние слоев

Оптимизация, объединяющая несколько последовательных слоев в одну вычислительную операцию, что снижает накладные расходы на память и улучшает параллелизм на граничных ускорителях.

Глоссарий ИИ

Бинарные нейронные сети

Структурированное прореживание

Динамические вычисления

Оптимизация TensorRT

TinyML

ONNX Runtime

Пост-обучающая квантизация

Разреженные нейронные сети

Слияние слоев

Результаты не найдены