Глоссарий ИИ
Полный словарь искусственного интеллекта
Ядро
Функция, выполняемая на GPU множеством потоков параллельно, составляющая фундаментальную единицу вычислений в программах CUDA для ускорения интенсивных математических операций.
Блок потоков
Группа потоков, которые могут взаимодействовать друг с другом через общую память и синхронизировать свое выполнение, составляющая базовую единицу планирования на потоковых мультипроцессорах (SM) GPU.
Варп
Группа из 32 потоков, выполняемых одновременно в режиме SIMD (Single Instruction, Multiple Data) на процессорах NVIDIA, представляющая фундаментальную аппаратную единицу выполнения.
Сетка
Совокупность блоков потоков, выполняющих одно и то же ядро, организованная в 1D, 2D или 3D структуру для эффективного отображения вычислительных задач на архитектуру GPU.
Занятость
Отношение между количеством активных варпов и максимальным количеством варпов, которые мультипроцессор может поддерживать одновременно, ключевой показатель для оптимизации использования ресурсов GPU.
Коммуникация хост-устройство
Механизм передачи данных между памятью CPU (хост) и памятью GPU (устройство) через шину PCIe, часто представляющий узкое место в гетерогенных приложениях.
PTX
Низкоуровневый промежуточный язык для GPU NVIDIA, оптимизированный для параллелизма потоков и служащий переносимой целью для компиляторов CUDA перед переводом в специфичный машинный код.
Библиотека Thrust
Библиотека шаблонов C++ для CUDA, предоставляющая высокоуровневый интерфейс, подобный STL, для параллельных алгоритмов на GPU, таких как сортировка, редукция и сканирование.