مو زيرو - مسرد الذكاء الاصطناعي

📖

المصطلحات

MuZero

خوارزمية التعلم بالتعزيز التي تتعلم في نفس الوقت نموذج انتقال ومكافأة وقيمة دون أي معرفة مسبقة بالديناميكية للبيئة.

📖

المصطلحات

نموذج القيمة

شبكة عصبية في MuZero التي تقدر القيمة المتوقعة للحالات المستقبلية، موجهة عملية التخطيط نحو الإجراءات الأكثر واعدة.

📖

المصطلحات

MCTS (بحث شجرة مونتي كارلو)

خوارزمية البحث الشجري المستخدمة في MuZero لاستكشاف مساحة الإجراءات المستقبلية بفعالية من خلال موازنة الاستغلال والاستكشاف في المحاكاة.

📖

المصطلحات

التخطيط

العملية التي يستخدم بها MuZero نموذجه المتعلم لمحاكاة وتقييم تسلسلات مختلفة من الإجراءات قبل اختيار أفضل إجراء للتنفيذ.

📖

المصطلحات

AlphaZero

خوارزمية سابقة لـ MuZero التي كانت تتطلب معرفة بقواعد اللعبة، على عكس MuZero الذي يتعلم نموذج البيئة ديناميكيًا.

📖

المصطلحات

اللعب الذاتي

طريقة تدريب حيث يلعب MuZero ضد نفسه لإنشاء بيانات تعلم، مما يسمح بتحسين مستمر بدون تدخل بشري.

📖

المصطلحات

مخزن التشغيل المؤقت

هيكل بيانات يخزن التجارب السابقة التي يعيد استخدامها MuZero لتدريب شبكاته بشكل فعال ومستقر.

📖

المصطلحات

التعميم في التخطيط

قدرة MuZero على تطبيق نموذجه المتعلم على حالات جديدة غير مُشاهدة خلال التدريب، مما يدل على قوة متميزة.

📖

المصطلحات

شبكة القيمة

شبكة عصبية تقوم بتقييم جودة حالة معينة من خلال التنبؤ بمجموع المكافآت المستقبلية المتوقعة من هذه الحالة.

📖

المصطلحات

شبكة السياسة

مكون في MuZero يقترح توزيع احتمالي على الإجراءات الممكنة، موجهًا الاستكشاف أثناء بحث MCTS.

📖

المصطلحات

التشغيل الذاتي

تقنية يستخدم فيها MuZero تنبؤاته الخاصة للتحسن بشكل متكرر، مما ينشئ دورة من التحسن الذاتي دون إشراف خارجي.

📖

المصطلحات

التعلم بالخيال

عملية يتعلم بها MuZero من المحاكاة الداخلية بدلاً من التفاعلات الحقيقية، مما يسمح له باستكشاف مساحة الحالات بكفاءة.

📖

المصطلحات

سياسة البحث

استراتيجية يستخدمها MuZero لاختيار الإجراءات التي سيتم استكشافها أثناء بحث MCTS، مع تحقيق التوازن الأمثل بين الاستكشاف والاستغلال.

قاموس الذكاء الاصطناعي

MuZero

نموذج القيمة

MCTS (بحث شجرة مونتي كارلو)

التخطيط

AlphaZero

اللعب الذاتي

مخزن التشغيل المؤقت

التعميم في التخطيط

شبكة القيمة

شبكة السياسة

التشغيل الذاتي

التعلم بالخيال

سياسة البحث

لم يتم العثور على نتائج