محولات الرؤية
ترميز الصورة (Visual Tokenization)
عملية تقسيم الصورة إلى تسلسل من الرموز المنفصلة، وهي أساسية لتكييف بنية المحول (Transformer) المصممة في الأصل للنصوص مع البيانات المرئية.
← رجوععملية تقسيم الصورة إلى تسلسل من الرموز المنفصلة، وهي أساسية لتكييف بنية المحول (Transformer) المصممة في الأصل للنصوص مع البيانات المرئية.
← رجوع