Apprentissage par Renforcement Partiellement Observable

📂

sous-catégories

POMDP (Partially Observable Markov Decision Process)

Cadre mathématique formel modélisant les environnements où l'agent ne perçoit qu'une observation partielle de l'état réel du système.

13 termes

📂

sous-catégories

États de Croyance

Représentation probabiliste des états possibles du système basée sur l'historique des observations et actions de l'agent.

13 termes

📂

sous-catégories

Filtres de Particules

Méthode d'estimation séquentielle utilisant des échantillons pondérés pour approximer la distribution de croyance dans les POMDP.

12 termes

📂

sous-catégories

Q-learning Partiellement Observable

Extension de l'algorithme Q-learning adaptée aux environnements où les états complets ne sont pas directement observables.

16 termes

📂

sous-catégories

Réseaux de Neurones Récurrents pour POMDP

Architecture neuronale utilisant des mémoires internes pour maintenir l'information historique nécessaire à la prise de décision.

13 termes

📂

sous-catégories

Exploration dans les POMDP

Stratégies d'exploration spécifiquement conçues pour gérer l'incertitude d'état dans les environnements partiellement observables.

16 termes

📂

sous-catégories

Apprentissage par Renforcement Hiérarchique pour POMDP

Approche décomposant les problèmes POMDP complexes en sous-tâches hiérarchiques pour améliorer l'efficacité d'apprentissage.

20 termes

📂

sous-catégories

Modèles Basés sur la Mémoire

Systèmes utilisant des mémoires externes explicites pour stocker et récupérer les informations historiques pertinentes.

10 termes

📂

sous-catégories

Apprentissage Multi-agents Partiellement Observable

Extension du POMDP aux scénarios impliquant plusieurs agents interagissant dans un environnement partiellement observable.

17 termes

📂

sous-catégories

Approximation de Politiques pour POMDP

Méthodes d'approximation permettant de calculer des politiques optimales ou quasi-optimales dans les espaces d'états de croyance de grande dimension.

19 termes

📂

sous-catégories

Deep POMDP

Combination de l'apprentissage profond avec les POMDP pour gérer des environnements complexes et à haute dimensionnalité.

17 termes

📂

sous-catégories

Transformeurs pour POMDP

Application des architectures transformer pour modéliser les dépendances temporelles longues dans les environnements partiellement observables.

9 termes

Glossaire IA

POMDP (Partially Observable Markov Decision Process)

États de Croyance

Filtres de Particules

Q-learning Partiellement Observable

Réseaux de Neurones Récurrents pour POMDP

Exploration dans les POMDP

Apprentissage par Renforcement Hiérarchique pour POMDP

Modèles Basés sur la Mémoire

Apprentissage Multi-agents Partiellement Observable

Approximation de Politiques pour POMDP

Deep POMDP

Transformeurs pour POMDP

Aucun résultat trouvé