ट्रांसफार्मर अनुकूलन
परत-वार सीखने की दर क्षय
वह अनुकूलन रणनीति जो परतों की गहराई के अनुसार भिन्न सीखने की दरें लागू करती है, आमतौर पर ऊपरी परतों के लिए अधिक।
← पीछेवह अनुकूलन रणनीति जो परतों की गहराई के अनुसार भिन्न सीखने की दरें लागू करती है, आमतौर पर ऊपरी परतों के लिए अधिक।
← पीछे