محولات الرؤية
أجزاء الصورة (Image Patches)
تقسيم الصورة إلى شبكات منتظمة من أقسام مربعة صغيرة (عادةً 16x16 بكسل) يتم التعامل معها كرموز متسلسلة بواسطة محول الرؤية (ViT).
← رجوعتقسيم الصورة إلى شبكات منتظمة من أقسام مربعة صغيرة (عادةً 16x16 بكسل) يتم التعامل معها كرموز متسلسلة بواسطة محول الرؤية (ViT).
← رجوع