المحولات متعددة الوسائط
MDETR (الكشف المعدّل للفهم متعدد الوسائط الشامل)
هندسة معمارية للكشف عن الكائنات شاملة (end-to-end) يتم تعديلها بواسطة اللغة الطبيعية، مما يتيح استعلامات نصية معقدة لتحديد موقع الكائنات والتعرف عليها في الصور.
← رجوع