KI-Glossar
Das vollständige Wörterbuch der Künstlichen Intelligenz
Bras d'une machine à sous
Action individuelle ou élémentaire dans un problème de bandit, associée à une distribution de récompense inconnue que l'agent peut tirer pour observer un retour quantitatif.
Contraintes structurelles
Ensemble de restrictions logiques ou mathématiques définissant les ensembles d'actions valides dans un problème de bandit combinatoire, souvent représentées par des structures comme les matroïdes ou les graphes.
Méthode CUCB
Adaptation de l'algorithme UCB au cadre combinatoire, utilisant un oracle pour trouver le sous-ensemble optimal d'actions basé sur les bornes supérieures de confiance individuelles.
Matroïde
Structure algébrique généralisant l'indépendance linéaire, fréquemment utilisée pour modéliser les contraintes dans les bandits combinatoires avec des propriétés d'optimalité algorithmique garanties.
Ensemble Indépendant
Sous-ensemble d'actions satisfaisant les contraintes structurelles du problème, typiquement défini par des propriétés de fermeture et d'échange dans le cadre théorique des matroïdes.
Oracle de Maximisation
Sous-algorithme utilisé dans les méthodes combinatoires pour trouver l'ensemble d'actions optimal selon un critère donné, souvent implémenté comme un solveur d'optimisation combinatoire.
Optimisation Linéaire
Technique mathématique pour maximiser ou minimiser une fonction linéaire sous contraintes linéaires, souvent employée dans la résolution des sous-problèmes d'optimisation dans les bandits combinatoires.
Graphe d'Interactions
Représentation graphique des dépendances et conflits entre actions dans un bandit combinatoire, où les nœuds symbolisent les actions et les arêtes encodent les contraintes mutuelles.
Almost Sure Convergence
Probabilistic property guaranteeing that an algorithm converges to optimality with probability 1, a strong criterion for analysis in combinatorial bandit theory.
Combinatorial Contextual Bandit
Extension of the combinatorial bandit where action selection depends on an observable context, enabling adaptive decisions based on the current state of the environment.