विजन ट्रांसफॉर्मर (ViT)
वर्गीकरण टोकन ([CLS])
पैच के अनुक्रम में जोड़ा गया विशेष टोकन, जिसकी अंतिम प्रस्तुति का उपयोग छवि के वैश्विक वर्गीकरण कार्य के लिए किया जाता है, जो एनएलपी में BERT के समान है।
← पीछे