🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📂
الفئات الفرعية

Q-Learning Épisodique

Algorithme d'apprentissage par renforcement off-policy qui apprend la fonction valeur-action à partir d'épisodes complets.

15 المصطلحات
📂
الفئات الفرعية

SARSA Épisodique

Algorithme on-policy qui met à jour les valeurs Q en suivant la politique actuelle à travers les épisodes.

15 المصطلحات
📂
الفئات الفرعية

Méthodes Monte Carlo

Techniques d'apprentissage basées sur l'échantillonnage complet d'épisodes pour estimer les valeurs.

16 المصطلحات
📂
الفئات الفرعية

Learning Temporel Différentiel

Combinaison des approches Monte Carlo et du bootstrapping pour l'apprentissage épisodique.

11 المصطلحات
📂
الفئات الفرعية

Policy Gradient Épisodique

Optimisation directe des paramètres de politique en utilisant les gradients des retours épisodiques.

8 المصطلحات
📂
الفئات الفرعية

Actor-Critic Épisodique

Architecture hybride combinant un acteur (politique) et un critique (évaluateur de valeur) pour l'apprentissage épisodique.

16 المصطلحات
📂
الفئات الفرعية

Exploration vs Exploitation

Dilemme fondamental dans la gestion des épisodes entre découvrir de nouvelles actions et exploiter les connaissances acquises.

13 المصطلحات
📂
الفئات الفرعية

Reward Shaping Épisodique

Modification des fonctions de récompense pour accélérer la convergence dans les cadres épisodiques.

17 المصطلحات
📂
الفئات الفرعية

Approximation de Fonction

Utilisation de réseaux de neurones ou autres approximateurs pour généraliser à travers les états épisodiques.

12 المصطلحات
📂
الفئات الفرعية

Multi-Armed Bandits Épisodiques

Cas simplifié d'apprentissage par renforcement avec des épisodes à une décision.

7 المصطلحات
📂
الفئات الفرعية

Apprentissage Hiérarchique

Décomposition des tâches complexes en sous-épisodes hiérarchiques pour faciliter l'apprentissage.

14 المصطلحات
📂
الفئات الفرعية

Curriculum Learning

Séquencement progressif des épisodes d'entraînement pour optimiser l'apprentissage.

13 المصطلحات
📂
الفئات الفرعية

Experience Replay Épisodique

Stockage et réutilisation sélective des expériences épisodiques pour améliorer l'efficacité d'apprentissage.

16 المصطلحات
📂
الفئات الفرعية

Credit Assignment Épisodique

Mécanismes pour attribuer correctement les récompenses aux actions au sein d'un épisode.

17 المصطلحات
📂
الفئات الفرعية

Meta-Learning Épisodique

Apprentissage à apprendre rapidement sur de nouvelles tâches en utilisant des méta-épisodes.

11 المصطلحات
🔍

لم يتم العثور على نتائج