🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles
📖
强化学习中的蒙特卡洛方法

GLIE 算法

一种探索策略,即在极限下贪婪且具有无限探索,保证渐近收敛到最优策略。随着时间推移,探索逐渐减少,而利用逐渐增加。

← 返回