Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Modèle de transition
Représentation mathématique de la dynamique de l'environnement qui décrit les probabilités de transition d'un état à un autre en fonction d'une action.
Apprentissage par renforcement basé sur modèle
Approche d'apprentissage où l'agent utilise un modèle appris ou connu de l'environnement pour simuler des trajectoires et améliorer sa politique.
Planification par recherche dans l'arbre
Méthode qui explore les futurs possibles en construisant un arbre de décisions basé sur le modèle de transition pour sélectionner l'action optimale.
Dynamique de l'environnement
Ensemble des règles et processus qui déterminent comment l'environnement évolue en réponse aux actions de l'agent.
Model Predictive Control (MPC)
Stratégie de contrôle qui optimise une séquence d'actions sur un horizon temporel limité en utilisant un modèle pour prédire les conséquences futures.
World Models
Architecture d'apprentissage combinant un modèle de vision, un modèle de transition et un contrôleur pour apprendre dans des environnements complexes.
Imagination-based RL
Approche où l'agent imagine et simule des scénarios futurs dans un modèle appris avant d'exécuter des actions dans le monde réel.
Model-based value iteration
Algorithme d'itération de la valeur utilisant un modèle pour calculer les valeurs d'état sans interaction directe avec l'environnement.
Ensemble models for dynamics
Technique utilisant plusieurs modèles de transition en parallèle pour quantifier l'incertitude et améliorer la robustesse de la planification.
Model-based policy iteration
Méthode itérative alternant entre évaluation et amélioration de politique en utilisant un modèle pour simuler les transitions.
Uncertainty-aware planning
Approche de planification qui tient compte de l'incertitude du modèle pour prendre des décisions plus robustes et exploratoires.
Model-based Monte Carlo
Méthode utilisant des simulations Monte Carlo basées sur un modèle pour estimer les valeurs d'état-action.
Short-horizon planning
Stratégie de planification limitée à un horizon temporel court pour réduire l'impact des erreurs d'accumulation du modèle.
Structured dynamics models
Modèles de transition incorporant des connaissances a priori sur la structure physique ou causale de l'environnement.