ट्रांसफार्मर अनुकूलन
मॉडल पैरेललिज़्म
वितरण रणनीति जहां मॉडल के विभिन्न घटक विभिन्न कम्प्यूटेशनल उपकरणों पर रखे जाते हैं, एक GPU की मेमोरी से बड़े मॉडल को संभालने के लिए।
← पीछेवितरण रणनीति जहां मॉडल के विभिन्न घटक विभिन्न कम्प्यूटेशनल उपकरणों पर रखे जाते हैं, एक GPU की मेमोरी से बड़े मॉडल को संभालने के लिए।
← पीछे