क्यू-लर्निंग
Processus de décision de Markov
Cadre mathématique pour modéliser les problèmes de décision séquentiels où les états futurs dépendent uniquement de l'état actuel et de l'action, respectant la propriété de Markov.
← पीछे