Глоссарий ИИ
Полный словарь искусственного интеллекта
235
категории
2 988
подкатегории
33 628
термины
термины
Reward Shaping
Technique consistant à modifier la fonction de récompense pour guider plus efficacement l'apprentissage de l'agent. Doit préserver l'optimalité tout en accélérant la convergence vers la solution souhaitée.
термины
Multi-Armed Bandit
Problème d'optimisation séquentielle simplifié où l'agent doit choisir entre plusieurs options avec des récompenses inconnues. Fondamental pour comprendre l'exploration-exploitation dans les contextes d'optimisation.
термины
Meta-Learning en RL
Paradigme où l'agent apprend à apprendre, développant des capacités d'adaptation rapide à de nouvelles tâches d'optimisation. Combine l'apprentissage par renforcement avec les principes du méta-apprentissage.
🔍