🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

محول الصوت (Audio Transformer)

هندسة محول (ترانسفورمر) مكيفة لمعالجة الإشارات الصوتية باستخدام آليات الانتباه على تمثيلات زمنية أو ترددية للبيانات الصوتية.

📖
المصطلحات

محول الطيف الترددي (Spectrogram Transformer)

نسخة من محول (ترانسفورمر) تعمل مباشرة على المخططات الطيفية (spectrograms) بتقطيعها إلى رقع (patches) تُعالج كسلاسل من التضمينات (embeddings) لتصنيف الصوت.

📖
المصطلحات

Wav2Vec 2.0

نموذج تعلم ذاتي الإشراف لتمثيل الكلام باستخدام هندسة محول (ترانسفورمر) مع إخفاء كمي (quantified masking) على الأشكال الموجية الخام.

📖
المصطلحات

ويسبير (Whisper)

نموذج محول (ترانسفورمر) قوي للتعرف على الكلام وترجمة الكلام إلى نص، مدرب على 680 ألف ساعة من البيانات الصوتية المنسوخة بإشراف ضعيف.

📖
المصطلحات

AudioLM

نموذج شبيه باللغة لتوليد الصوت باستخدام محولات (ترانسفورمرز) هرمية على تمثيلات صوتية ودلالية منفصلة.

📖
المصطلحات

Encodec

ترميز عصبي (codec) يعتمد على محول (ترانسفورمر) مع تكميم متبقي (residual quantization) لضغط الصوت وإعادة بنائه بجودة عالية.

📖
المصطلحات

VALL-E

نموذج لغة ترميز عصبي (neural codec language) لتوليف الكلام باستخدام محولات (ترانسفورمرز) لتوليد كلام عالي الجودة من موجهات صوتية مدتها 3 ثوانٍ.

📖
المصطلحات

Wav2Vec-U

نهج غير خاضع للإشراف (unsupervised) للتعرف التلقائي على الكلام (ASR) باستخدام نماذج wav2vec 2.0 المدربة مسبقًا بدون نسخ، مستغلًا المحاذاة الصوتية الضمنية.

📖
المصطلحات

ميوزيك جين

نموذج ترانسفورمر شرطي لتوليد الموسيقى باستخدام مُرمّزات صوتية ويمكن التحكم فيه بواسطة أوصاف نصية أو ألحان.

📖
المصطلحات

ميرت

محول تمثيل غلاف الموسيقى، نموذج مُدرب مسبقًا ذاتي الإشراف لفهم الموسيقى باستخدام تمثيلات متعددة المقاييس.

📖
المصطلحات

سبيك تو فيك

هندسة ترانسفورمر تحول الأطياف الصوتية إلى تضمينات متجهة لمهام التصنيف والاسترجاع الصوتي.

🔍

لم يتم العثور على نتائج