قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نموذج الانتشار الكامن
هيكلية انتشار تعمل في فضاء كامن ذو أبعاد أقل، يتم الحصول عليه عبر مشفر ذاتي، لتقليل التكاليف الحسابية بشكل كبير مع الحفاظ على جودة عالية لتوليد الصور.
المشفر الإدراكي
جزء من المشفر الذاتي في نموذج الانتشار الكامن (LDM) يحول صورة عالية الأبعاد (بكسلات) إلى تمثيل منخفض الأبعاد (كامن)، مما يلتقط المعلومات الدلالية الأساسية.
التكييف عبر الانتباه (Cross-Attention)
آلية انتباه تسمح لنموذج الانتشار الكامن بدمج معلومات غير متجانسة، مثل النص (تضمينات CLIP)، لتوجيه توليد الصور بطريقة مرنة ودقيقة.
مجدول الضجيج
خوارزمية تحدد تباين الضجيج المضاف في كل خطوة زمنية من العملية الأمامية، مما يؤثر على سرعة التقارب والجودة النهائية للتوليد في نماذج الانتشار الكامن.
انحدار الضجيج (إزالة الضجيج)
المهمة الرئيسية لنموذج الانتشار U-Net، والتي تتمثل في التنبؤ بالضجيج المضاف إلى كامن في خطوة زمنية معينة، مما يسمح بطرحه لإزالة الضجيج من الإشارة تدريجياً.
شبكة U-Net الهرمية
هيكلية للشبكة العصبية على شكل حرف U، مع اتصالات متبقية وآليات انتباه، تُستخدم كقلب لنموذج الانتشار للتنبؤ بالضجيج في كل مرحلة من مراحل إزالة الضجيج.
التوجيه الخالي من المصنف (CFG)
طريقة تكييف تستخدم تدرج اللوغاريتم الاحتمالي للنموذج نفسه لزيادة الالتزام بالموجه، مما يتجنب الحاجة إلى مصنف خارجي ويحسن الدقة النصية.
الانتشار المستقر
تطبيق مفتوح المصدر ومشهور لهيكلية نموذج الانتشار الكامن، يجمع بين VAE و U-Net والتكييف بالنص عبر CLIP لتوليد صور متاح وعالي الأداء.
مطابقة النقاط العشوائية (SDE)
إطار نظري بديل لنماذج الانتشار، يفسرها على أنها حل معادلة تفاضلية عشوائية لتعلم تدرج كثافة البيانات (النقاط).
إعادة العينة الكامنة (Latent Resampling)
تقنية استدلال تعدل ديناميكيًا مسار إزالة الضجيج في الفضاء الكامن لتحسين الاتساق وجودة التوليدات، من خلال ضبط الخطوات الزمنية أو التوجيه.
تقطير الوقت
عملية ضغط النموذج يتم فيها استخدام نموذج انتشار بطيء كبير لتدريب نموذج أصغر وأسرع، قادر على توليد صور بجودة مماثلة في خطوات أقل لإزالة الضجيج.
إزالة الضجيج المتسقة
عائلة من طرق الاستدلال التي تحل معادلة تفاضلية عادية (ODE) لتقريب عملية إزالة الضجيج، مما يسمح بتوليدات عالية الجودة في خطوة واحدة أو في خطوات قليلة جدًا.
ترميز الموجه (Tokenisation)
خطوة معالجة مسبقة يتم فيها تحويل النص المدخل إلى تسلسل من المعرفات الرقمية (الرموز)، والتي سيتم تحويلها لاحقًا إلى تضمينات بواسطة نموذج اللغة (مثل: CLIP) لغرض الشرط.
خسارة إعادة البناء KL
مصطلح تنظيم في تدريب المشفر التلقائي المتغير (VAE) لنموذج الانتشار الكامن (LDM)، يقيس تباعد كولباك-ليبلر بين التوزيع الكامن المتعلم والتوزيع المسبق (عادة ما يكون غاوسيًا قياسيًا).
مساحة التضمين النصي
مساحة متجهية عالية الأبعاد يتم فيها تمثيل النصوص (الموجهات) في شكل تضمينات، وتعمل كشرط لنموذج الانتشار عبر آلية الانتباه المتقاطع.