बहु-मोडल ट्रांसफॉर्मर्स
यूनिफाइड एनकोडर-डिकोडर
ट्रांसफॉर्मर आर्किटेक्चर जहां एक ही एनकोडर सभी इनपुट मोडैलिटीज को प्रोसेस करता है, और एक डिकोडर आउटपुट उत्पन्न करता है, जिससे VQA, कैप्शनिंग और रिट्रीवल जैसे टास्क एक ही मॉडल के साथ संभव होते हैं।
← पीछे