🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📖
thuật ngữ

UCB1

Algorithme UCB de base utilisant l'inégalité de Hoeffding pour calculer les bornes de confiance, offrant un regret logarithmique garanti dans le cadre des bandits stationnaires.

📖
thuật ngữ

UCB1-Tuned

Variante améliorée de UCB1 qui adapte dynamiquement les bornes de confiance en fonction de la variance observée des récompenses pour optimiser l'exploration.

📖
thuật ngữ

UCB-V

Algorithme UCB utilisant explicitement les estimations de variance pour construire des bornes de confiance plus précises, particulièrement efficace avec des récompenses à forte variance.

📖
thuật ngữ

UCB-alpha

Généralisation paramétrique de UCB1 où le paramètre alpha contrôle l'agressivité de l'exploration, permettant d'ajuster le compromis exploration-exploitation selon les besoins.

📖
thuật ngữ

MOSS (Minimax Optimal Strategy)

Algorithme UCB optimal au sens minimax qui atteint le regret minimal dans le pire cas en adaptant les bornes de confiance au nombre total d'itérations restantes.

📖
thuật ngữ

KL-UCB

Variante de UCB utilisant la divergence de Kullback-Leibler pour construire des bornes de confiance asymptotiquement optimales, particulièrement adaptée aux récompenses bornées.

📖
thuật ngữ

Regret logarithmique

Mesure de performance des algorithmes UCB où le regret cumulé croît logarithmiquement avec le temps, caractérisant l'optimalité dans les problèmes de bandits stationnaires.

📖
thuật ngữ

Optimisme face à l'incertitude

Principe philosophique et mathématique guidant les algorithmes UCB, postulant que les actions incertaines méritent d'être explorées car elles pourraient être optimales.

📖
thuật ngữ

Confidence Index

Index quantifying the level of statistical certainty on an action estimation, used to weight exploration in advanced variants of UCB algorithms.

📖
thuật ngữ

Asymptotic Optimality

Theoretical property guaranteeing that a UCB algorithm asymptotically achieves the lowest possible regret bound, characterizing its long-term efficiency.

📖
thuật ngữ

UCB-Normal

UCB variant specifically designed for rewards following a normal distribution, leveraging exact properties of the Gaussian distribution for optimal bounds.

📖
thuật ngữ

Efficient UCB

Family of UCB algorithms achieving optimal computational complexity while preserving logarithmic regret guarantees for large-scale problems.

📖
thuật ngữ

Upper Confidence Trees (UCT)

Application of the UCB principle to search trees for sequential decision-making, foundation of many game algorithms such as AlphaGo using Monte Carlo Tree Search.

🔍

Không tìm thấy kết quả