قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الانتشار متعدد الوسائط
فئة من النماذج التوليدية التي تتعلم توزيعًا احتماليًا مشتركًا عبر وسائط متعددة (نص، صورة، صوت) من خلال عملية انتشار مشتركة أو منسقة.
الفضاء الكامن الموحد
تمثيل متجهي مشترك حيث تُسقط بيانات الوسائط المختلفة للسماح بتفاعلها وتحويلها المتبادل داخل نموذج الانتشار.
التكييف المتقاطع
تقنية حيث يتم توجيه عملية توليد وسيط واحد بواسطة معلومات من وسيط آخر، مثل توليد صورة من نص أو صوت من صورة.
الضوضاء المنظمة متعددة الوسائط
عملية إضافة ضضاء تحافظ على الارتباطات بين الوسائط، من خلال تدهور الوسائط المختلفة بشكل مشترك للحفاظ على محاذاتها الدلالية طوال عملية الانتشار.
إزالة الضوضاء المنسقة
مرحلة إزالة الضوضاء حيث تتبادل الشبكات العصبية المخصصة لكل وسيط المعلومات لإعادة بناء البيانات بشكل متماسك من نسختها المضوضرة المشتركة.
المشفر متعدد الوسائط
شبكة عصبية مسؤولة عن إسقاط بيانات الوسائط المختلفة في الفضاء الكامن الموحد، capturing خصائصها الأساسية وعلاقاتها.
فك الشفرة متعدد الوسائط
شبكة عصالية تعيد بناء بيانات كل وسيط من تمثيلها في الفضاء الكامن الموحد بعد عملية إزالة الضوضاء.
المحاذاة بين الوسائط
هدف تعلم يهدف إلى تقليل المسافة بين التمثيلات الكامنة للوسائط المختلفة التي تصف نفس المفهوم، مما يضمن اتساقها الدلالي.
النموذج الموحد للانتشار
هندسة نموذج واحد تعالج وتولد في نفس الوقت عدة وسائط باستخدام عملية انتشار واحدة ومجموعة مشتركة من الأوزان.
التوجيه متعدد الوسائط
تقنية استدلال تستخدم تدرج نموذج تصنيف متعدد الوسائط لتوجيه عملية أخذ العينات نحو مخرجات أكثر توافقاً مع شرط معين.
الانتشار متعدد الأذرع
هندسة حيث تمتلك عملية انتشار مركزية 'أذرع' متخصصة للتعامل مع الضوضاء وإزالتها الخاصة بكل وسيط مع مشاركة جذع مشترك.
خسارة الاتساق متعدد الوسائط
دالة خسارة تعاقب على عدم الاتساق الدلالي بين الوسائط المولدة، تُقاس مثلاً عبر مسافة جيب التمام في الفضاء الكامن الموحد.
أخذ العينات بين الوسائط
عملية توليف يتم فيها أخذ عينات من وسيط مع الاستناد إلى وسيط آخر موجود مسبقاً أو مولّد في نفس الوقت.
شبكة توقع الضوضاء المشتركة
مكون مركزي لنموذج الانتشار، غالباً ما يكون بنية U-Net، حيث الطبقات السفلية مشتركة بين الوسائط والطبقات العليا متخصصة.
تضمين الوقت متعدد الوسائط
تمثيل خطوة الوقت لعملية الانتشار الذي يتم حقنه في النموذج، غالباً ما يكون مشروطاً بالوسيط للتعامل مع ديناميكيات ضوضاء مختلفة.
انتشار التسلسل متعدد الوسائط
تطبيق الانتشار على البيانات التسلسلية التي تشمل عدة وسائط، مثل توليد الفيديو (صورة + وقت) أو الحوار المتزامن (صوت + نص).
التجزئة متعددة الوسائط
عملية تحويل بيانات الوسائط المختلفة إلى سلسلة من الرموز الموحدة التي يمكن معالجتها بواسطة بنية المحول في إطار الانتشار.