🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

التعلم خارج السياسة

طريقة تعلم حيث يتعلم الوكيل سياسة مثالية أثناء اتباعه لسياسة سلوك أخرى، مما يسمح باستكشاف أفضل.

📖
المصطلحات

الشبكات المستهدفة

شبكات عصبية مكررة بأوزان يتم تحديثها ببطء لاستقرار التعلم من خلال توفير أهداف أكثر اتساقًا.

📖
المصطلحات

عملية أورنشتاين-أولينبيك

عملية عشوائية تستخدم لتوليد ضوضاء مرتبطة زمنياً في الإجراءات، مما يسهل الاستكشاف الفعال في المساحات المستمرة.

📖
المصطلحات

مساحة الإجراء المستمرة

بيئة حيث يمكن للإجراءات أن تأخذ أي قيمة في فترة مستمرة، مما يتطلب خوارزميات متكيفة على عكس الإجراءات المنفصلة.

📖
المصطلحات

تقريب دالة الشبكة العصبية

استخدام الشبكات العصبية لتقريب وظائف معقدة مثل السياسات أو وظائف القيمة في التعلم المعزز.

📖
المصطلحات

التحديث الناعم

طريقة التحديث التدريجي للشبكات المستهدفة باستخدام معامل tau (τ) لخلط أوزان الشبكات الرئيسية والمستهدفة ببطء.

📖
المصطلحات

شبكة الممثل

شبكة عصبية تتعلم تحويل الحالات مباشرة إلى الإجراءات المثلى في مساحة الإجراء المستمرة.

📖
المصطلحات

السياسة الحتمية

سياسة تربط إجراءً محددًا بكل حالة، على عكس السياسات العشوائية التي تعيد توزيعات الاحتمالات.

📖
المصطلحات

ضوضاء الإجراء

ضوضاء مضافة إلى الإجراءات التي ينتجها الممثل لتشجيع استكشاف مساحة الإجراء المستمرة أثناء التدريب

🔍

لم يتم العثور على نتائج