AI 용어집

인공지능 완전 사전

162

카테고리

2,032

하위 카테고리

23,060

용어

📖

용어

Reward Shaping

Technique consistant à modifier la fonction de récompense pour guider plus efficacement l'apprentissage de l'agent. Doit préserver l'optimalité tout en accélérant la convergence vers la solution souhaitée.

📖

용어

Multi-Armed Bandit

Problème d'optimisation séquentielle simplifié où l'agent doit choisir entre plusieurs options avec des récompenses inconnues. Fondamental pour comprendre l'exploration-exploitation dans les contextes d'optimisation.

📖

용어

Meta-Learning en RL

Paradigme où l'agent apprend à apprendre, développant des capacités d'adaptation rapide à de nouvelles tâches d'optimisation. Combine l'apprentissage par renforcement avec les principes du méta-apprentissage.

🔍

AI 용어집

Reward Shaping

Multi-Armed Bandit

Meta-Learning en RL

결과를 찾을 수 없습니다