AI 词汇表
人工智能完整词典
Renforcement Continuel
Extension de l'apprentissage par renforcement où l'agent apprend continuellement de nouvelles tâches ou environnements sans réinitialiser ses connaissances acquises.
Dilemme Plasticité-Stabilité
Tension fondamentale entre la capacité d'un modèle à s'adapter à de nouvelles informations (plasticité) et sa capacité à conserver les connaissances existantes (stabilité).
Apprentissage Incrémental de Tâches
Scénario d'apprentissage continu où les tâches sont présentées séquentiellement avec des identifiants de tâche clairs lors de l'entraînement et de l'inférence.
Apprentissage Incrémental de Domaine
Forme d'apprentissage continu où la distribution des données change progressivement sans modification explicite des tâches ou des classes.
Apprentissage Incrémental de Classes
Scénario où de nouvelles classes sont introduites séquentiellement, nécessitant l'adaptation du classifieur sans accès aux données des classes précédentes.
Buffer de Replay Mémoire
Espace de stockage limité conservant des échantillons représentatifs des tâches passées pour leur réutilisation lors de l'apprentissage de nouvelles tâches.
Meta-Apprentissage Continu
Approche combinant méta-apprentissage et apprentissage continu pour développer des modèles capables d'apprendre rapidement de nouvelles tâches tout en préservant les anciennes.
Renforcement par Apprentissage à Vie
Paradigme où un agent d'apprentissage par renforcement accumule des connaissances sur une durée prolongée, s'adaptant continuellement à de nouveaux environnements et tâches.
前向迁移
在持续学习场景中,当前任务的学习受益于先前任务所获得知识的现象。
后向迁移
新任务的学习反向提升先前任务性能的效果,理想但实践中罕见。
任务感知学习
一种持续学习方法,系统知晓当前任务的标识,从而实现更有效的专门化。
任务无关学习
一种持续学习场景,系统必须在无显式任务标识信息的情况下隐式识别当前任务。
持续强化学习中的课程学习
一种按复杂度递增顺序依次组织强化学习任务的策略,以促进技能的持续获取。
多任务强化学习
一种范式,智能体在强化学习环境中同时或顺序学习完成多个不同任务。