Параллелизм моделей
Offloading
Стратегия управления памятью, при которой данные (веса, градиенты, активации) динамически перемещаются между быстрой памятью GPU и более медленной, но более объемной памятью CPU.
← Назад