المحولات متعددة الوسائط
GIT
نموذز Generative Image-to-text Transformer يعالج الصور كلغة أجنبية ويستخدم بنية بسيطة من المشفر-المفكك لوصف الصور والأسئلة المرئية مع أداء متقدم.
← رجوعنموذز Generative Image-to-text Transformer يعالج الصور كلغة أجنبية ويستخدم بنية بسيطة من المشفر-المفكك لوصف الصور والأسئلة المرئية مع أداء متقدم.
← رجوع