🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

主动强化学习

结合主动学习与强化学习原则的混合方法论,用于优化待标注样本的选择。

📖
个术语

样本选择策略

确定性或随机性策略,定义在预算约束下请求标注哪些数据以最大化模型改进。

📖
个术语

强化学习智能体

通过与标注环境交互学习最优样本选择决策的算法实体。

📖
个术语

奖励函数

量化每次样本选择动作效用的信号,通常基于模型性能的提升。

📖
个术语

状态-动作-价值

Q(s,a)函数,估计从状态s选择动作a并遵循最优策略后的预期累积奖励。

📖
个术语

深度强化学习

强化学习的扩展,使用深度神经网络来近似价值函数或策略。

📖
个术语

基于不确定性的主动学习

智能体优先选择模型预测不确定性最大的样本的策略。

📖
个术语

战略性样本选择

优化的决策过程,旨在识别最大化信息增益与标注成本比的数据子集。

📖
个术语

Apprentissage par Renforcement hors Politique

Méthode permettant d'apprendre une politique optimale en suivant une autre politique de comportement, utile pour l'exploration flexible.

📖
个术语

Apprentissage par Renforcement en Ligne

Paradigme où l'agent apprend et sélectionne des échantillons simultanément pendant l'annotation, adaptant dynamiquement sa stratégie.

📖
个术语

Équilibre Apprentissage-Annotation

Optimisation du compromis entre le temps consacré à la sélection intelligente et les gains potentiels en performance du modèle.

📖
个术语

Stratégie d'Acquisition de Données

Plan d'action systématique pour identifier et collecter les données les plus pertinentes à annoter selon des critères prédéfinis.

📖
个术语

Apprentissage par Renforcement Multi-agents

Extension où plusieurs agents collaborent ou compétitionnent pour optimiser conjointement la stratégie de sélection d'échantillons.

📖
个术语

Algorithme Q-Learning Actif

Variante du Q-learning adaptée à l'apprentissage actif, où les actions correspondent à la sélection d'échantillons à annoter.

📖
个术语

Politique d'Exploration Guidée

Stratégie d'exploration orientée vers les régions de l'espace de données potentiellement les plus informatives pour le modèle.

📖
个术语

Apprentissage par Renforcement Bayésien

Méthode intégrant l'incertitude dans l'estimation des fonctions de valeur pour une prise de décision plus robuste en sélection d'échantillons.

🔍

未找到结果