المحولات متعددة الوسائط
محوّل الفيديو
نسخة من محوّل الرؤية (Vision Transformer) مُكيّفة للمعالجة المتسلسلة لإطارات الفيديو، وتدمج المعلومات الزمنية عبر الانتباه المكاني الزماني.
← رجوعنسخة من محوّل الرؤية (Vision Transformer) مُكيّفة للمعالجة المتسلسلة لإطارات الفيديو، وتدمج المعلومات الزمنية عبر الانتباه المكاني الزماني.
← رجوع