BenchVibe AI Ecosystem

VIP 👤

🏠 Accueil

基準測試

📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction

Modèles

🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code

Ressources

💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200

類別

2,608

子類別

30,011

術語

奖励塑形

一种修改奖励函数以更有效引导智能体学习的技术。必须在保持最优性的同时加速收敛到期望解。

多臂老虎机

一种简化的顺序优化问题，智能体必须在多个具有未知奖励的选项中进行选择。对于理解优化情境中的探索-利用权衡至关重要。

强化学习中的元学习

一种智能体学习如何学习的范式，发展出快速适应新优化任务的能力。将强化学习与元学习原理相结合。

🔍

搵唔到結果