BenchVibe AI Ecosystem

VIP 👤

🏠 Accueil

基準測試

📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction

Modèles

🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code

Ressources

💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles

AI 詞彙表

人工智能完整詞典

200

類別

2,608

子類別

30,011

術語

批量逆向强化学习

一种从固定的专家演示集合中学习而不需要与环境主动交互的逆向强化学习方法。

主动逆强化学习

一种IRL方法，其中智能体主动选择要执行的动作，以更好地理解专家的奖励函数。

贝叶斯逆向强化学习

使用贝叶斯推理框架，通过演示数据建模奖励函数不确定性的逆向强化学习方法。

基于偏好的逆向强化学习

一种IRL方法，通过比较轨迹间的偏好而非完整演示来推断奖励函数。

分层逆向强化学习

一种IRL方法，将复杂任务分解为分层子任务，以学习多层次的奖励函数。

多智能体逆向强化学习

将IRL扩展到多智能体交互环境，需要学习集体或个体奖励机制。

深度逆强化学习

利用深度神经网络从高维数据中表示和学习复杂的奖励函数。

对抗性逆向强化学习

使用对抗性游戏技术的IRL框架，其中生成器和判别器相互对抗以学习奖励函数。

逆向强化学习与强化学习

将IRL问题转化为标准RL问题的方法，其中智能体学习最大化演示数据的似然性。

半监督逆向强化学习

结合标记演示与未标记数据以改进奖励学习的IRL方法。

机器人学的逆向强化学习

IRL在机器人和导航中从人类示范学习行为模式的专门应用

基于用户反馈的逆向强化学习

一种主动整合用户定性反馈以迭代优化奖励函数的IRL方法。

合作式逆向强化学习

一种IRL框架，其中人类与AI积极协作，共同定义和优化奖励目标。

逆向强化学习用于规划

利用IRL从现有计划中提取隐含目标，以改进未来的规划系统。

最大熵逆向强化学习

一种优先选择具有最大熵的奖励解决方案的IRL方法，以避免对演示数据的过拟合。

🔍

搵唔到結果