Глоссарий ИИ
Полный словарь искусственного интеллекта
Бинарные нейронные сети
Нейронные сети, веса и активации которых ограничены бинарными значениями (+1/-1), обеспечивающие экстремальное сжатие и значительное ускорение инференса.
Структурированное прореживание
Техника прореживания, удаляющая целые структуры, такие как фильтры, каналы или полные слои, что позволяет получить реальный выигрыш в производительности, в отличие от неструктурированного прореживания.
Динамические вычисления
Стратегия, адаптирующая вычислительную сложность модели в зависимости от входных данных или ограничений ресурсов, оптимизирующая энергопотребление и задержку на периферийных устройствах.
Оптимизация TensorRT
Набор оптимизаций от NVIDIA, включающий слияние слоев, калибровку точности и авто-настройку для максимизации производительности инференса на периферийных GPU.
TinyML
Область машинного обучения, направленная на развертывание ультракомпактных моделей ИИ (<1 МБ) на микроконтроллерах с крайне ограниченными ресурсами (ОЗУ <256 КБ).
ONNX Runtime
Кроссплатформенный движок инференса, оптимизирующий выполнение моделей в формате ONNX на различных аппаратных архитектурах, включая периферийные устройства и IoT.
Пост-обучающая квантизация
Техника квантизации, применяемая после полного обучения модели, использующая небольшой калибровочный набор данных для определения оптимальных параметров квантизации.
Разреженные нейронные сети
Нейронные сети, содержащие большую долю нулевых или близких к нулю весов, что позволяет добиться значительных вычислительных и存储 оптимизаций на периферийных платформах.
Слияние слоев
Оптимизация, объединяющая несколько последовательных слоев в одну вычислительную операцию, что снижает накладные расходы на память и улучшает параллелизм на граничных ускорителях.