قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
محاذاة الأنماط
عملية تدريب تهدف إلى محاذاة مساحات التمثيل لأنماط مختلفة في فضاء متجه مشترك لتسهيل عمليات النقل عبر الأنماط.
بيرسيفر
هندسة محوّل عامة قادرة على معالجة بيانات متعددة الأنماط عشوائية باستخدام آلية انتباه متقاطع بين المدخلات والعنق الزجاجي الكامن.
التدريب المسبق الموحد متعدد الأنماط
نهج يقوم بتدريب نموذج واحد مسبقًا على مهام وأنماط متعددة في وقت واحد للحصول على تمثيلات أكثر عمومية وقابلية للنقل.
محوّل وصف الصور
هندسة محوّل من نوع المشفّر-المفكّك تقوم بتوليد أوصاف نصية وصفية ومتماسكة تلقائيًا للصور المدخلة.
محوّل سمعي بصري
نموذج محوّل يعالج تدفقات الصوت والفيديو في وقت واحد لمهام مثل التعرف السمعي البصري أو التوليد المتزامن.
محوّل الفيديو
نسخة من محوّل الرؤية (Vision Transformer) مُكيّفة للمعالجة المتسلسلة لإطارات الفيديو، وتدمج المعلومات الزمنية عبر الانتباه المكاني الزماني.
دمج متعدد الأنماط قائم على المحوّل
تقنية تستخدم آليات الانتباه في المحوّلات لدمج ميزات الأنماط المتعددة بذكاء على المستوى الدلالي.