🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Квантизация

Процесс снижения численной точности весов и активаций модели ИИ для оптимизации вывода и уменьшения занимаемой памяти.

📖
термины

8-битная квантизация

Техника сжатия, уменьшающая веса модели с 32 бит до 8 бит, обеспечивающая оптимальный компромисс между производительностью и точностью для LLM.

📖
термины

4-битная квантизация

Метод экстремального сжатия, уменьшающий веса до 4 бит, позволяющий получить значительный выигрыш в памяти, но с потенциальной потерей качества.

📖
термины

Посттренировочная квантизация (PTQ)

Техника, применяемая после обучения модели, преобразующая веса в пониженную точность без необходимости полного переобучения.

📖
термины

Обучение с учетом квантизации (QAT)

Подход к обучению, имитирующий эффекты квантизации в процессе обучения для минимизации потери точности.

📖
термины

Динамическая квантизация

Метод, применяемый при выводе, когда активации квантуются на лету, обеспечивая гибкость, но с вычислительными накладными расходами.

📖
термины

Статическая квантизация

Подход, предварительно вычисляющий параметры квантизации перед выводом, оптимизируя скорость в ущерб гибкости.

📖
термины

Калибровка квантизации

Процесс определения оптимальных параметров квантизации (масштаб, нулевая точка) на основе репрезентативной выборки данных.

📖
термины

GPTQ

Градиентная посттренировочная квантификация, продвинутая техника, итеративно оптимизирующая квантифицированные веса для минимизации ошибки реконструкции.

📖
термины

AWQ

Квантификация весов с учетом активаций, метод взвешивания важности весов в соответствии с амплитудой соответствующих активаций.

📖
термины

Квантификация без обучения

Техника, не требующая калибровочных данных, использующая эвристики на основе распределения весов для квантификации модели.

📖
термины

Смешанная точность квантификации

Стратегия применения различных уровней точности квантификации в зависимости от слоев модели для оптимизации компромисса производительность/точность.

📖
термины

Симметричная квантификация

Схема квантификации, где диапазон значений центрирован вокруг нуля, упрощающая вычисления, но потенциально не полностью использующая динамический диапазон.

📖
термины

Асимметричная квантификация

Подход, позволяющий использовать диапазоны значений, не центрированные на нуле, оптимизируя использование квантифицированного диапазона для асимметричных распределений.

📖
термины

Масштабный коэффициент

Мультипликативный параметр, используемый для отображения непрерывных значений в квантифицированный диапазон, критически важный для точности квантификации.

📖
термины

Нулевая точка

Смещение, добавляемое при асимметричной квантификации для выравнивания нулевого значения с плавающей запятой с квантифицированным представлением.

📖
термины

Квантовый шум

Ошибка, вносимая при снижении точности, проявляющаяся как ухудшение производительности модели из-за аппроксимации весов.

📖
термины

Тонкая настройка с учетом квантования

Процесс легкой корректировки после квантования, направленный на восстановление точности, потерянной при сжатии модели.

📖
термины

SmoothQuant

Техника квантования, выравнивающая сложность квантования между весами и активациями посредством предварительного математического преобразования.

📖
термины

LLM.int8()

Специфический метод 8-битного квантования для больших языковых моделей, сочетающий матричное разложение и гибридное квантование.

🔍

Результаты не найдены