المحولات متعددة الوسائط
BEiT-3
نموذج Bidirectional Encoder representation from Image Transformer v3 يستخدم متعدد المسارات Transformer مع تضمينات خاصة بالوسائط لمعالجة الصورة والنص والصورة-النص بطريقة موحدة.
← رجوع