الأسئلة والأجوبة متعددة الوسائط
ترميز الصورة
عملية تحويل الصورة إلى تسلسل من الرموز المميزة المنفصلة، غالبًا عبر VAE أو VQ-VAE، لجعلها متوافقة مع بنيات من نوع Transformer.
← رجوععملية تحويل الصورة إلى تسلسل من الرموز المميزة المنفصلة، غالبًا عبر VAE أو VQ-VAE، لجعلها متوافقة مع بنيات من نوع Transformer.
← رجوع