قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نموذج انتشار الفيديو
هندسة توليد تطبق عملية الانتشار على البيانات المكانية-الزمانية، حيث تضيف تدريجياً ضوضاء إلى صور تسلسل فيديو قبل أن تتعلم إزالة الضوضاء لإعادة بناء أو إنشاء مقاطع فيديو متماسكة.
الانتشار الكامن المكاني-الزماني
نوع من نماذج انتشار الفيديو يعمل في فضاء كامن مضغوط، مما يقلل التعقيد الحسابي من خلال تطبيق عملية إضافة الضوضاء وإزالتها على تمثيلات ذات أبعاد منخفضة بدلاً من البكسلات الخام لكل إطار.
الانتباه ثلاثي الأبعاد
آلية انتباه تعالج الأبعاد المكانية (الارتفاع، العرض) والزمانية (الوقت) للفيديو في وقت واحد، مما يسمح للنموذج بترجيح أهمية المناطق المختلفة عبر اللحظات المختلفة لالتقاط التبعيات المكانية-الزمانية.
حقن الوقت (التضمين الزمني)
تقنية ترميز المعلومات الزمنية (خطوة الانتشار، الموضع في التسلسل) في شكل متجهات يتم حقنها في الشبكة، لتوجيه عملية التوليد للحفاظ على الاتساق والحركة مع مرور الوقت.
إزالة الضوضاء المشروطة بالإطار السابق
إستراتيجية حيث يتم شرط توقع الضوضاء لإطار فيديو على النسخة المنظفة من الإطار السابق، مما يضمن استمرارية واتساق زمني قوي بين الصور المتعاقبة في التسلسل المُولد.
هندسة U-Net ثلاثية الأبعاد
هيكل شبكة عصبية تلافيفية مكيفة لبيانات الفيديو، تجمع بين مسارات المُشفر-فك التشفير مع اتصالات ثلاثية الأبعاد متبقية لالتقاط السياقات متعددة المقاييس المكانية والزمانية بكفاءة أثناء إزالة الضوضاء.
الفضاء الكامن المكاني-الزماني
تمثيل مضغوط ومجرد لتسلسل فيديو، حيث يتم ترميز المعلومات المكانية والزمانية في متجه أو خريطة ميزات ذات أبعاد منخفضة، لتخدم كأساس لتوليد أو معالجة مقاطع الفيديو.
التوجيه الخالي من المصنف (CFG) للفيديو
طريقة للتحكم في توليد الفيديو بدون مصنف صريح، من خلال تدريب نموذج على كل من البيانات الشرطية (مثل: النص) وغير الشرطية، ثم الاستيفاء بين تنبؤاتها لضبط الالتزام بالمطالبة مع الحفاظ على التنوع.
جدولة النشر الزمني
تخطيط عدد خطوات إزالة الضوضاء المخصصة لكل إطار أو لمقاطع زمنية، يمكن أن تكون موحدة أو تكيفية لتحسين الجودة والاتساق العام للفيديو المُنشأ بناءً على تعقيد الحركة.
التحسين الزمني للدقة بالنشر
تطبيق نماذج النشر لزيادة تردد الإطارات (fps) للفيديو، من خلال إنشاء إطارات وسيطة متسقة تستكمل الحركة والتغييرات بين الإطارات الموجودة بطريقة واقعية.
ترميم الفيديو بالنشر
عملية ملء المناطق المفقودة أو المُقنعة في تسلسل الفيديو باستخدام نموذج نشر، الذي يُنشأ بكسل متسقة مكانيًا وزمنيًا بناءً على سياق الإطارات المحيطة.
نمذجة الحركة الكامنة
تقنية حيث يتم نمذجة الحركة في الفيديو وإنشاؤها مباشرة في الفضاء الكامن، غالبًا من خلال التنبؤ بالإزاحات أو التحولات بين الرموز الكامنة للإطارات المتتالية، قبل فك تشفيرها إلى صور.
الاتساق الزمني بالقيود
نهج يضيف عقوبة أو قيد صريح في دالة الخسارة للنموذج لثني التغيرات في المظهر (مثل: اللون، الملمس) غير المرتبطة بالحركة بين الإطارات المتجاورة، مما يعزز الاستقرار البصري.
تحليل الضوضاء المكانية الزمنية
طريقة متقدمة حيث يتم تحليل الضوضاء المضافة والمتنبأ بها بواسطة النموذج إلى مكون مكاني (المظهر) ومكون زمني (الحركة)، مما يسمح بتحكم أدق وإنشاء أكثر متانة لمقاطع الفيديو الديناميكية.
الانحدار الذاتي على الرموز الكامنة للنشر
استراتيجية هجينة تُنشأ الفيديو بطريقة انحدارية ذاتية إطارًا بإطار، حيث يتم إنتاج كل رمز كامن من خلال خطوة نشر مشروطة بالرموز الكامنة السابقة، تجمع بين اتساق الانحدار الذاتي وجودة النشر.
تطبيع الخصائص الزمنية
طبقة تطبيقية تُطبق على البعد الزمني لخرائط الخصائص في U-Net ثلاثي الأبعاد، تثبت التدريب من خلال ضمان بقاء توزيع التنشيطات متسقًا عبر المراحل الزمنية المختلفة للتسلسل.