🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📂
sous-catégories

Bandits Multi-bras Classiques

Problème fondamental où l'agent choisit parmi plusieurs options pour maximiser la récompense cumulative.

10 termes
📂
sous-catégories

Algorithmes Epsilon-Glouton

Stratégie qui exploite la meilleure action connue avec probabilité 1-ε et explore aléatoirement avec probabilité ε.

10 termes
📂
sous-catégories

Algorithmes UCB

Méthodes basées sur les bornes supérieures de confiance qui équilibrent exploration et exploitation via des intervalles statistiques.

13 termes
📂
sous-catégories

Thompson Sampling

Approche bayésienne qui échantillonne des paramètres selon leur distribution postérieure pour prendre des décisions.

0 termes
📂
sous-catégories

Bandits Contextuels

Extension où les décisions dépendent de caractéristiques contextuelles observées à chaque tour.

10 termes
📂
sous-catégories

Bandits Linéaires

Modèles où la récompense attendue est une fonction linéaire des caractéristiques contextuelles.

12 termes
📂
sous-catégories

Bandits Non Stationnaires

Cadre où les distributions de récompense changent au cours du temps, nécessitant une adaptation continue.

13 termes
📂
sous-catégories

Bandits Combinatoires

Problèmes où l'agent sélectionne des ensembles d'actions simultanément avec des contraintes structurelles.

10 termes
📂
sous-catégories

Bandits Adversaires

Scénario où un adversaire choisit les récompenses pour minimiser le gain de l'agent.

10 termes
📂
sous-catégories

Bandits en Cascade

Modèle où les items sont présentés séquentiellement jusqu'à ce que l'utilisateur clique sur l'un d'entre eux.

14 termes
📂
sous-catégories

Bandits avec Feedback Limité

Situations où seule une information partielle sur les récompenses est observée après chaque action.

14 termes
📂
sous-catégories

Bandits pour Publicité Online

Application spécifique pour l'optimisation des campagnes publicitaires en temps réel.

8 termes
📂
sous-catégories

Bandits pour Tests A/B

Alternative intelligente aux tests A/B traditionnels pour l'optimisation des expériences web.

5 termes
📂
sous-catégories

Bandits pour Recommandations

Systèmes qui apprennent les préférences utilisateur pour personnaliser les recommandations.

7 termes
📂
sous-catégories

Bandits Hiérarchiques

Structures multi-niveaux où les décisions sont organisées en hiérarchie pour des problèmes complexes.

10 termes
🔍

Aucun résultat trouvé