قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
Approximation de fonction
Technique permettant d'estimer des fonctions de valeur ou de politique dans des espaces d'états continus en utilisant des paramètres ajustables plutôt que des tables explicites.
Réseaux de neurones d'approximation
Architectures neuronales utilisées comme approximateurs universels pour représenter des fonctions Q ou politiques dans des espaces à grande dimension.
Méthodes tabulaires étendues
Extension des algorithmes de RL classiques comme Q-learning ou SARSA aux espaces continus via l'approximation de fonction plutôt que des tables de valeurs.
Espaces d'états continus
Environnements où les états peuvent prendre une infinité de valeurs dans un intervalle continu, nécessitant une généralisation plutôt que mémorisation.
Deep Q-Network (DQN)
Architecture de RL combinant Q-learning avec des réseaux de neurones profonds pour gérer des espaces d'états à haute dimension comme les pixels d'images.
Approximation de fonction de valeur
Méthode consistant à estimer V(s) ou Q(s,a) à l'aide d'un approximateur paramétré θ pour généraliser à travers des états similaires.
Généralisation en RL
Capacité d'un agent à transférer ses connaissances apprises sur des états observés à des états non vus mais similaires.
Malédiction de la dimensionnalité
Phénomène où la complexité computationnelle croît exponentiellement avec le nombre de dimensions de l'espace d'états.
استخراج الخصائص
عملية تحويل الحالات الأولية إلى تمثيلات معلوماتية مناسبة لتقريب الدالة في التعلم المعزز.
التقريب الخطي
طريقة تقريب يتم فيها تمثيل دالة القيمة ك تركيب خطي للخصائص φ(s) مع الأوزان w.
دوال القاعدة الشعاعية
دوال تنشيط مُحلّية في فضاء الحالة، وتُستخدم كمقربيات عالمية في التعلم المعزز المستمر.
استقرار التقارب
خاصية تضمن أن خوارزمية التقريب تتقارب نحو حل مثالي تحت شروط معينة.