قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
تصنيف مشاهد الفيديو
عملية ذكاء اصطناعي تقوم تلقائيًا بتصنيف البيئات والسياقات البصرية في تسلسلات الفيديو باستخدام شبكات عصبية عميقة لتحليل الخصائص المكانية والزمانية.
شبكة عصبية تلافيفية مكانية-زمانية (CNN spatio-temporelle)
هندسة شبكة عصبية تعالج الأبعاد المكانية (الارتفاع، العرض) والزمانية (الوقت) للفيديوهات في آن واحد لالتقاط ديناميكيات المشاهد.
التدفق البصري
تقنية حاسوبية تحسب حركة البكسلات بين الصور المتتالية للكشف عن حركة الكائنات وتغيرات المشهد في الفيديوهات.
شبكات التدفق المزدوج
هندسة شبكة عصبية تلافيفية (CNN) تعالج بالتوازي المعلومات البصرية الثابتة (تدفق RGB) ومعلومات الحركة (التدفق البصري) لتصنيف فيديو قوي.
شبكة عصبية تلافيفية ثلاثية الأبعاد (CNN 3D)
شبكة عصبية تلافيفية تستخدم تلافيف ثلاثية الأبعاد لاستخراج الميزات مباشرة من أحجام الفيديو، وبالتالي الحفاظ على المعلومات الزمنية.
آلية الانتباه في الفيديو
وحدة تعلم عميق تقوم بوزن أهمية المناطق المكانية والزمانية المختلفة في الفيديو ديناميكيًا لتحسين التصنيف.
التجزئة الزمنية
عملية تقسم الفيديو تلقائيًا إلى مقاطع زمنية متماسكة بناءً على تغيرات المشهد أو الحركة لتحليل أدق.
تحليل سياق المشهد
طريقة تقيّم العلاقات بين الكائنات، الإجراءات، والبيئة لفهم السياق العام لمشهد الفيديو قبل التصنيف.
تضمين الفيديو
تمثيل متجهي كثيف ومضغوط للفيديو يلتقط خصائصه الأساسية لمهام التصنيف والتشابه.
أخذ عينات الإطارات
استراتيجية اختيار ذكية للصور الرئيسية في الفيديو لتحسين الأداء الحسابي مع الحفاظ على المعلومات ذات الصلة.
LSTM للفيديو
نسخة من الشبكات العصبية المتكررة مصممة خصيصًا لنمذجة التبعيات طويلة المدى في التسلسلات الزمنية للفيديو.
المحول للفيديو
هندسة معمارية تعتمد على آليات الانتباه التي تعالج مقاطع الفيديو كتسلسلات من الرقع المكانية-الزمانية لتصنيف فعال.
تجميع خصائص الفيديو
تقنية تجمع الخصائص المستخرجة من إطارات متعددة لإنشاء تمثيل موحد لمشهد الفيديو.
توليد رسوم بيانية للمشهد
طريقة تبني تمثيلات منظمة للعلاقات بين الكائنات والإجراءات في الفيديو لفهم دلالي عميق.
التعلم متعدد الوسائط للفيديو
نهج يدمج في وقت واحد أنواعًا متعددة من البيانات (مرئي، صوتي، نصي) لتحسين متانة تصنيف المشاهد.
خصائص مكانية-زمانية
واصفات تلتقط بشكل مشترك المظهر المكاني للكائنات وتطورها الزمني لتمثيل مشاهد الفيديو بفعالية.
التعرف على الأفعال في الفيديو
مهمة فرعية للتصنيف تحدد على وجه التحديد الأفعال البشرية أو حركات الكائنات في تسلسلات الفيديو.
اكتشاف الكائنات في الفيديو
تقنية تحدد وتتعرف على الكائنات الموجودة في كل إطار من الفيديو مع ضمان الاتساق الزمني للاكتشافات.