Параллелизм моделей
Параллелизм данных с сегментацией
Комбинация параллелизма данных и стратегии ZeRO, где веса модели разделяются между рабочими узлами при сохранении параллелизма данных.
← Назад