نماذج الانتشار الكامن - مسرد الذكاء الاصطناعي

📖

المصطلحات

نموذج الانتشار الكامن

هيكلية انتشار تعمل في فضاء كامن ذو أبعاد أقل، يتم الحصول عليه عبر مشفر ذاتي، لتقليل التكاليف الحسابية بشكل كبير مع الحفاظ على جودة عالية لتوليد الصور.

📖

المصطلحات

المشفر الإدراكي

جزء من المشفر الذاتي في نموذج الانتشار الكامن (LDM) يحول صورة عالية الأبعاد (بكسلات) إلى تمثيل منخفض الأبعاد (كامن)، مما يلتقط المعلومات الدلالية الأساسية.

📖

المصطلحات

التكييف عبر الانتباه (Cross-Attention)

آلية انتباه تسمح لنموذج الانتشار الكامن بدمج معلومات غير متجانسة، مثل النص (تضمينات CLIP)، لتوجيه توليد الصور بطريقة مرنة ودقيقة.

📖

المصطلحات

مجدول الضجيج

خوارزمية تحدد تباين الضجيج المضاف في كل خطوة زمنية من العملية الأمامية، مما يؤثر على سرعة التقارب والجودة النهائية للتوليد في نماذج الانتشار الكامن.

📖

المصطلحات

انحدار الضجيج (إزالة الضجيج)

المهمة الرئيسية لنموذج الانتشار U-Net، والتي تتمثل في التنبؤ بالضجيج المضاف إلى كامن في خطوة زمنية معينة، مما يسمح بطرحه لإزالة الضجيج من الإشارة تدريجياً.

📖

المصطلحات

شبكة U-Net الهرمية

هيكلية للشبكة العصبية على شكل حرف U، مع اتصالات متبقية وآليات انتباه، تُستخدم كقلب لنموذج الانتشار للتنبؤ بالضجيج في كل مرحلة من مراحل إزالة الضجيج.

📖

المصطلحات

التوجيه الخالي من المصنف (CFG)

طريقة تكييف تستخدم تدرج اللوغاريتم الاحتمالي للنموذج نفسه لزيادة الالتزام بالموجه، مما يتجنب الحاجة إلى مصنف خارجي ويحسن الدقة النصية.

📖

المصطلحات

الانتشار المستقر

تطبيق مفتوح المصدر ومشهور لهيكلية نموذج الانتشار الكامن، يجمع بين VAE و U-Net والتكييف بالنص عبر CLIP لتوليد صور متاح وعالي الأداء.

📖

المصطلحات

مطابقة النقاط العشوائية (SDE)

إطار نظري بديل لنماذج الانتشار، يفسرها على أنها حل معادلة تفاضلية عشوائية لتعلم تدرج كثافة البيانات (النقاط).

📖

المصطلحات

إعادة العينة الكامنة (Latent Resampling)

تقنية استدلال تعدل ديناميكيًا مسار إزالة الضجيج في الفضاء الكامن لتحسين الاتساق وجودة التوليدات، من خلال ضبط الخطوات الزمنية أو التوجيه.

📖

المصطلحات

تقطير الوقت

عملية ضغط النموذج يتم فيها استخدام نموذج انتشار بطيء كبير لتدريب نموذج أصغر وأسرع، قادر على توليد صور بجودة مماثلة في خطوات أقل لإزالة الضجيج.

📖

المصطلحات

إزالة الضجيج المتسقة

عائلة من طرق الاستدلال التي تحل معادلة تفاضلية عادية (ODE) لتقريب عملية إزالة الضجيج، مما يسمح بتوليدات عالية الجودة في خطوة واحدة أو في خطوات قليلة جدًا.

📖

المصطلحات

ترميز الموجه (Tokenisation)

خطوة معالجة مسبقة يتم فيها تحويل النص المدخل إلى تسلسل من المعرفات الرقمية (الرموز)، والتي سيتم تحويلها لاحقًا إلى تضمينات بواسطة نموذج اللغة (مثل: CLIP) لغرض الشرط.

📖

المصطلحات

خسارة إعادة البناء KL

مصطلح تنظيم في تدريب المشفر التلقائي المتغير (VAE) لنموذج الانتشار الكامن (LDM)، يقيس تباعد كولباك-ليبلر بين التوزيع الكامن المتعلم والتوزيع المسبق (عادة ما يكون غاوسيًا قياسيًا).

📖

المصطلحات

مساحة التضمين النصي

مساحة متجهية عالية الأبعاد يتم فيها تمثيل النصوص (الموجهات) في شكل تضمينات، وتعمل كشرط لنموذج الانتشار عبر آلية الانتباه المتقاطع.

قاموس الذكاء الاصطناعي

نموذج الانتشار الكامن

المشفر الإدراكي

التكييف عبر الانتباه (Cross-Attention)

مجدول الضجيج

انحدار الضجيج (إزالة الضجيج)

شبكة U-Net الهرمية

التوجيه الخالي من المصنف (CFG)

الانتشار المستقر

مطابقة النقاط العشوائية (SDE)

إعادة العينة الكامنة (Latent Resampling)

تقطير الوقت

إزالة الضجيج المتسقة

ترميز الموجه (Tokenisation)

خسارة إعادة البناء KL

مساحة التضمين النصي

لم يتم العثور على نتائج