Optimisation Robuste et Stochastique
Bandits Manchots
Problème d'optimisation séquentielle explorant le compromis entre exploitation et exploration dans un environnement incertain. Il modélise des situations où des décisions doivent être prises avec des informations partielles sur les récompenses futures.
← رجوع