قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

📖

المصطلحات

Distributional Correction

Technique corrigeant le décalage entre la distribution des états-actions visités offline et celle générée par la politique apprise pendant le transfert online.

📖

المصطلحات

Fitted Q-Iteration

Algorithme itératif d'apprentissage offline approximant la fonction Q optimale en utilisant des régresseurs sur des batches de données expérimentales.

📖

المصطلحات

Safe Policy Transfer

Stratégie garantissant que les politiques transférées de l'offline à l'online maintiennent des performances minimales pendant la phase d'adaptation initiale.

📖

المصطلحات

Dataset Aggregation

Méthode itérative collectant et agrégeant des données offline successives pour améliorer progressivement les performances de la politique avant déploiement online.

📖

المصطلحات

Offline Policy Evaluation

Évaluation des performances d'une politique sans interaction directe avec l'environnement, cruciale pour sélectionner les meilleures politiques à transférer online.

📖

المصطلحات

Transfer Learning Gap

Mesure quantitative de la différence de performance entre une politique entraînée offline et ses performances initiales en environnement online.

🔍

قاموس الذكاء الاصطناعي

Distributional Correction

Fitted Q-Iteration

Safe Policy Transfer

Dataset Aggregation

Offline Policy Evaluation

Transfer Learning Gap

لم يتم العثور على نتائج