🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

MuZero

خوارزمية التعلم بالتعزيز التي تتعلم في نفس الوقت نموذج انتقال ومكافأة وقيمة دون أي معرفة مسبقة بالديناميكية للبيئة.

📖
المصطلحات

نموذج القيمة

شبكة عصبية في MuZero التي تقدر القيمة المتوقعة للحالات المستقبلية، موجهة عملية التخطيط نحو الإجراءات الأكثر واعدة.

📖
المصطلحات

MCTS (بحث شجرة مونتي كارلو)

خوارزمية البحث الشجري المستخدمة في MuZero لاستكشاف مساحة الإجراءات المستقبلية بفعالية من خلال موازنة الاستغلال والاستكشاف في المحاكاة.

📖
المصطلحات

التخطيط

العملية التي يستخدم بها MuZero نموذجه المتعلم لمحاكاة وتقييم تسلسلات مختلفة من الإجراءات قبل اختيار أفضل إجراء للتنفيذ.

📖
المصطلحات

AlphaZero

خوارزمية سابقة لـ MuZero التي كانت تتطلب معرفة بقواعد اللعبة، على عكس MuZero الذي يتعلم نموذج البيئة ديناميكيًا.

📖
المصطلحات

اللعب الذاتي

طريقة تدريب حيث يلعب MuZero ضد نفسه لإنشاء بيانات تعلم، مما يسمح بتحسين مستمر بدون تدخل بشري.

📖
المصطلحات

مخزن التشغيل المؤقت

هيكل بيانات يخزن التجارب السابقة التي يعيد استخدامها MuZero لتدريب شبكاته بشكل فعال ومستقر.

📖
المصطلحات

التعميم في التخطيط

قدرة MuZero على تطبيق نموذجه المتعلم على حالات جديدة غير مُشاهدة خلال التدريب، مما يدل على قوة متميزة.

📖
المصطلحات

شبكة القيمة

شبكة عصبية تقوم بتقييم جودة حالة معينة من خلال التنبؤ بمجموع المكافآت المستقبلية المتوقعة من هذه الحالة.

📖
المصطلحات

شبكة السياسة

مكون في MuZero يقترح توزيع احتمالي على الإجراءات الممكنة، موجهًا الاستكشاف أثناء بحث MCTS.

📖
المصطلحات

التشغيل الذاتي

تقنية يستخدم فيها MuZero تنبؤاته الخاصة للتحسن بشكل متكرر، مما ينشئ دورة من التحسن الذاتي دون إشراف خارجي.

📖
المصطلحات

التعلم بالخيال

عملية يتعلم بها MuZero من المحاكاة الداخلية بدلاً من التفاعلات الحقيقية، مما يسمح له باستكشاف مساحة الحالات بكفاءة.

📖
المصطلحات

سياسة البحث

استراتيجية يستخدمها MuZero لاختيار الإجراءات التي سيتم استكشافها أثناء بحث MCTS، مع تحقيق التوازن الأمثل بين الاستكشاف والاستغلال.

🔍

لم يتم العثور على نتائج