Processus Observables Partiellement
Politique non-markovienne
Stratégie de décision qui dépend de tout l'historique des observations et actions plutôt que uniquement du dernier état observé. Dans les POMDP, les politiques optimales sont nécessairement non-markoviennes car l'état n'est pas directement observable.
← Indietro