Глоссарий ИИ
Полный словарь искусственного интеллекта
TVM (Tensor Virtual Machine)
Фреймворк компиляции с открытым исходным кодом, предназначенный для оптимизации и выполнения тензоров на различных аппаратных архитектурах, снижая уровень абстракции моделей глубокого обучения.
Just-In-Time (JIT) Compilation
Техника компиляции, которая преобразует байт-код или промежуточный код в машинный код во время выполнения, позволяя оптимизации на основе фактического состояния системы.
Ahead-of-Time (AOT) Compilation
Процесс компиляции исходного кода в машинный код до выполнения, снижающий задержку запуска и позволяющий агрессивные оптимизации независимо от среды выполнения.
Graph IR (Intermediate Representation)
Абстрактное представление графа вычислений модели ИИ, используемое компиляторами для анализа зависимостей и применения оптимизирующих преобразований перед генерацией кода.
Operator Fusion
Техника оптимизации, которая объединяет несколько элементарных операций графа вычислений в одно вычислительное ядро, снижая накладные расходы на память и улучшая локальность данных.
Auto-scheduling
Автоматизированный процесс поиска лучшей конфигурации выполнения (тайлинг, векторизация, параллелизация) для вычислительного ядра на заданной целевой аппаратной архитектуре.
Target-specific Optimization
Набор техник компиляции, которые адаптируют сгенерированный код к уникальным характеристикам аппаратной архитектуры (CPU, GPU, TPU, ASIC) для максимизации производительности.
Relay IR
Функциональное промежуточное представление высокого уровня в TVM, поддерживающее графы вычислений с потоком управления и позволяющее сложные семантические оптимизации.
Выражение тензора (TE)
Специфичный для домена язык в TVM для описания вычислений над тензорами на высоком уровне абстракции, облегчающий автоматическую генерацию оптимизированного кода для различных целей.
Автонастройка ядра
Процесс систематического исследования пространства параметров оптимизации вычислительного ядра для определения конфигурации, обеспечивающей наилучшую производительность на конкретном оборудовании.
HLO (High-Level Optimizer) IR
Промежуточное представление, используемое XLA, описывающее вычисления в виде высокоуровневых операций над тензорами, оптимизированное перед генерацией кода для ускорителей.
Генерация кода (Codegen)
Финальный этап компиляции, при котором оптимизированное промежуточное представление преобразуется в исполняемый машинный код для конкретной целевой архитектуры.
Многогранная модель
Математическая модель, используемая для представления и преобразования вложенных циклов, позволяющая выполнять сложные оптимизации, такие как тайлинг и автоматическая параллелизация.
LLVM (Low Level Virtual Machine)
Модульная инфраструктура компиляции, используемая многими компиляторами ИИ для генерации оптимизированного машинного кода для различных архитектур процессоров.
Оптимизация расположения памяти
Техника реорганизации данных в памяти для улучшения пространственной и временной локальности, уменьшения задержек доступа и увеличения вычислительной производительности.
Уровень аппаратной абстракции (HAL)
Программный интерфейс, скрывающий специфические детали базового оборудования, позволяющий компиляторам генерировать переносимый код с использованием нативных оптимизаций.
Векторизация
Техника оптимизации, которая преобразует скалярные операции в векторные (SIMD), используя параллельные вычислительные блоки современных процессоров.
Тайлинг
Стратегия разделения данных на блоки (tiles) для улучшения повторного использования кеша и эффективности параллелизации в тензорных вычислениях.
Переписывание графа
Систематическое преобразование вычислительного графа путем применения правил переписывания для замены подграфов более производительными эквивалентами.