قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

📖

المصطلحات

التعلم خارج السياسة

طريقة تعلم حيث يتعلم الوكيل سياسة مثالية أثناء اتباعه لسياسة سلوك أخرى، مما يسمح باستكشاف أفضل.

📖

المصطلحات

الشبكات المستهدفة

شبكات عصبية مكررة بأوزان يتم تحديثها ببطء لاستقرار التعلم من خلال توفير أهداف أكثر اتساقًا.

📖

المصطلحات

عملية أورنشتاين-أولينبيك

عملية عشوائية تستخدم لتوليد ضوضاء مرتبطة زمنياً في الإجراءات، مما يسهل الاستكشاف الفعال في المساحات المستمرة.

📖

المصطلحات

مساحة الإجراء المستمرة

بيئة حيث يمكن للإجراءات أن تأخذ أي قيمة في فترة مستمرة، مما يتطلب خوارزميات متكيفة على عكس الإجراءات المنفصلة.

📖

المصطلحات

تقريب دالة الشبكة العصبية

استخدام الشبكات العصبية لتقريب وظائف معقدة مثل السياسات أو وظائف القيمة في التعلم المعزز.

📖

المصطلحات

التحديث الناعم

طريقة التحديث التدريجي للشبكات المستهدفة باستخدام معامل tau (τ) لخلط أوزان الشبكات الرئيسية والمستهدفة ببطء.

📖

المصطلحات

شبكة الممثل

شبكة عصبية تتعلم تحويل الحالات مباشرة إلى الإجراءات المثلى في مساحة الإجراء المستمرة.

📖

المصطلحات

السياسة الحتمية

سياسة تربط إجراءً محددًا بكل حالة، على عكس السياسات العشوائية التي تعيد توزيعات الاحتمالات.

📖

المصطلحات

ضوضاء الإجراء

ضوضاء مضافة إلى الإجراءات التي ينتجها الممثل لتشجيع استكشاف مساحة الإجراء المستمرة أثناء التدريب

🔍

قاموس الذكاء الاصطناعي

التعلم خارج السياسة

الشبكات المستهدفة

عملية أورنشتاين-أولينبيك

مساحة الإجراء المستمرة

تقريب دالة الشبكة العصبية

التحديث الناعم

شبكة الممثل

السياسة الحتمية

ضوضاء الإجراء

لم يتم العثور على نتائج