Оптимизация трансформеров
Конвейерный параллелизм
Форма параллелизма моделей, при которой слои распределены по разным GPU и обрабатываются в конвейере для улучшения использования ресурсов.
← Назад