Thuật ngữ AI
Từ điển đầy đủ về Trí tuệ nhân tạo
162
danh mục
2.032
danh mục con
23.060
thuật ngữ
thuật ngữ
Bandits contextuels
Extension des bandits classiques où les décisions dépendent de contextes ou états observables pour personnaliser les choix.
thuật ngữ
Regret en optimisation
Mesure de performance quantifiant la différence entre le gain cumulé obtenu et le gain optimal possible avec information parfaite.
thuật ngữ
Exploration linéaire
Stratégie d'exploration où la probabilité d'explorer diminue linéairement avec le temps pour favoriser l'exploitation progressive.
thuật ngữ
Gradient bandit
Algorithme utilisant des estimations de gradient pour ajuster les préférences d'action basées sur les récompenses reçues.
thuật ngữ
Optimisation PAC
Cadre Probably Approximately Correct garantissant avec probabilité 1-δ que l'erreur est inférieure à ε après un nombre d'essais.
🔍