قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

📖

المصطلحات

Model-Based Offline RL

Approche d'apprentissage par renforcement offline qui apprend un modèle dynamique de l'environnement pour générer des données synthétiques et améliorer la politique sans interaction réelle.

📖

المصطلحات

Imagination Rollouts

Trajectoires simulées générées en utilisant le modèle appris de l'environnement pour explorer des états futurs potentiels sans interaction réelle avec l'environnement.

📖

المصطلحات

Conservative Policy Optimization

Algorithme qui pénalise explicitement les politiques qui s'écartent significativement du comportement des données d'entraînement pour éviter les erreurs d'extrapolation.

📖

المصطلحات

Uncertainty Quantification

Technique permettant d'estimer l'incertitude du modèle dynamique dans les régions hors-distribution pour guider l'exploration et éviter les erreurs catastrophiques.

📖

المصطلحات

Ensemble Models

Collection de plusieurs modèles dynamiques entraînés avec différentes initialisations pour estimer l'incertitude épistémique par la variance des prédictions.

📖

المصطلحات

Trajectory Transformers

Architecture transformer qui modélise les trajectoires comme des séquences d'états, actions et récompenses pour prédire les transitions futures en apprentissage offline.

📖

المصطلحات

Offline-to-Online Transfer

Processus de transfert d'une politique apprise offline vers un environnement en ligne pour affinement et adaptation continue avec interaction réelle.

📖

المصطلحات

Model Ensembling

Technique utilisant plusieurs modèles dynamiques pour capturer différentes hypothèses sur la transition d'état et améliorer la robustesse des prédictions.

📖

المصطلحات

Advantage Weighted Regression

Méthode offline qui pondère les actions dans les données d'entraînement selon leur avantage estimé pour améliorer la politique au-delà du simple clonage.

📖

المصطلحات

Out-of-Distribution Detection

Mécanisme pour identifier quand les états générés par le modèle s'écartent significativement de la distribution des données d'entraînement originales.

🔍

قاموس الذكاء الاصطناعي

Model-Based Offline RL

Imagination Rollouts

Conservative Policy Optimization

Uncertainty Quantification

Ensemble Models

Trajectory Transformers

Offline-to-Online Transfer

Model Ensembling

Advantage Weighted Regression

Out-of-Distribution Detection

لم يتم العثور على نتائج