الأسئلة والأجوبة متعددة الوسائط - مسرد الذكاء الاصطناعي

📖

المصطلحات

النمطية المتقاطعة

قدرة النظام على فهم وربط المعلومات من أنماط مختلفة، مثل النص والصور، لإثراء الفهم السياقي.

📖

المصطلحات

محول الرؤية واللغة (VLT)

بنية محول مدربة مسبقًا على مجموعات كبيرة من الصور والنصوص المقترنة، مصممة لمهام الفهم والتوليد متعددة الأنماط.

📖

المصطلحات

الاستدلال البصري

قدرة نظام الإجابة على الأسئلة على استنتاج معلومات غير صريحة من خلال تحليل العلاقات المكانية أو سمات الكائنات أو المشاهد المعقدة في الصورة.

📖

المصطلحات

التأريض البصري

عملية ربط المفاهيم اللغوية (الكلمات، الجمل) بكيانات أو مناطق محددة في صورة أو فيديو، مما يخلق رابطًا دلاليًا ملموسًا.

📖

المصطلحات

محاذاة النمط-إلى-النمط

عملية تعلم تطابق أجزاء من نمط (مثل جملة) مع الأجزاء ذات الصلة من نمط آخر (مثل منطقة صورة).

📖

المصطلحات

كتاب الرموز المتجهي الكمي (VQ)

تقنية تستخدم في النماذج متعددة الأنماط لتقسيم التمثيلات المستمرة (مثل الصور) إلى مجموعة محدودة من الرموز المنفصلة، مما يسهل معالجتها بواسطة نماذج اللغة.

📖

المصطلحات

بيرسيبترون متعدد الأنماط (MLP)

شبكة عصبية، غالبًا ما تكون MLP، تأخذ الميزات المدمجة من أنماط متعددة كمدخلات لأداء مهمة تصنيف أو انحدار نهائية.

📖

المصطلحات

نموذج الدمج ثنائي التدفق

بنية يتم فيها معالجة كل نمط بواسطة شبكة عصبية منفصلة (تدفق) قبل دمج تمثيلاتها لاتخاذ قرار مشترك.

📖

المصطلحات

استرجاع المعلومات متعدد الوسائط

مهمة تتضمن العثور على مستندات (مثل: صور) ذات صلة بناءً على استعلام في وسائط أخرى (مثل: نص)، بالاعتماد على تشابهها في مساحة تضمين مشتركة.

📖

المصطلحات

توليد استجابة شرطية

عملية يقوم فيها نموذج لغوي بتوليد استجابة نصية يكون محتواها مشروطًا وموجهًا بالمعلومات المستخرجة من وسائط غير نصية مثل الصورة.

📖

المصطلحات

ترميز الصورة

عملية تحويل الصورة إلى تسلسل من الرموز المميزة المنفصلة، غالبًا عبر VAE أو VQ-VAE، لجعلها متوافقة مع بنيات من نوع Transformer.

قاموس الذكاء الاصطناعي

النمطية المتقاطعة

محول الرؤية واللغة (VLT)

الاستدلال البصري

التأريض البصري

محاذاة النمط-إلى-النمط

كتاب الرموز المتجهي الكمي (VQ)

بيرسيبترون متعدد الأنماط (MLP)

نموذج الدمج ثنائي التدفق

استرجاع المعلومات متعدد الوسائط

توليد استجابة شرطية

ترميز الصورة

لم يتم العثور على نتائج