🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📂
个子类别

经典多臂赌博机

智能体在多个选项中进行选择以最大化累积奖励的基础问题。

10 个术语
📂
个子类别

Epsilon-贪婪算法

一种以 1-ε 的概率利用已知最佳动作,并以 ε 的概率随机探索的策略。

10 个术语
📂
个子类别

UCB算法

基于置信上限的方法,通过统计区间平衡探索与利用。

13 个术语
📂
个子类别

汤普森采样

根据参数的后验分布对参数进行采样以做出决策的贝叶斯方法。

0 个术语
📂
个子类别

上下文强盗

一种扩展,其决策取决于每一轮观察到的上下文特征。

10 个术语
📂
个子类别

线性强盗

期望奖励是上下文特征的线性函数的模型。

12 个术语
📂
个子类别

非平稳强盗

奖励分布随时间变化,需要持续适应的框架。

13 个术语
📂
个子类别

组合强盗

代理在结构约束下同时选择动作集的问题

10 个术语
📂
个子类别

对抗性强盗

对手选择奖励以最小化智能体收益的场景。

10 个术语
📂
个子类别

级联强盗

项目依次呈现,直到用户点击其中一项的模型。

14 个术语
📂
个子类别

有限反馈多臂老虎机

每次行动后仅能观察到部分奖励信息的情况。

14 个术语
📂
个子类别

在线广告多臂老虎机

用于实时优化广告活动的专用应用程序。

8 个术语
📂
个子类别

用于 A/B 测试的强盗算法

用于网页体验优化的传统 A/B 测试的智能替代方案

5 个术语
📂
个子类别

用于推荐的强盗算法

学习用户偏好以个性化推荐的系统。

7 个术语
📂
个子类别

分层强盗

多层结构,其中决策按层次组织以解决复杂问题。

10 个术语
🔍

未找到结果