🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📖
용어

PPO (Proximal Policy Optimization)

Algorithme d'apprentissage par renforcement largement utilisé dans RLHF qui maintient les mises à jour de politique proches de la politique précédente pour assurer une stabilité d'entraînement.

📖
용어

Reward Model

Modèle entraîné sur des données de préférences humaines pour prédire les scores de récompense, servant de fonction objectif dans le processus RLHF.

📖
용어

Human Preference Dataset

Ensemble de données collectées où des évaluateurs humains comparent différentes réponses du modèle, créant des classements qui servent de base pour entraîner le modèle de récompense.

📖
용어

Alignment

Processus visant à faire correspondre le comportement des modèles d'IA avec les valeurs, intentions et préférences humaines pour garantir des interactions sûres et bénéfiques.

📖
용어

Supervised Fine-Tuning (SFT)

Phase préliminaire d'entraînement où le modèle apprend à partir d'exemples démontratifs de haute qualité, créant une base solide avant l'alignement RLHF.

📖
용어

Safety Training

Ensemble de techniques visant à rendre les modèles d'IA plus sûrs en évitant les réponses harmful, biaisées ou inappropriées à travers des mécanismes d'alignement spécifiques.

📖
용어

Reward Hacking

Phénomène où le modèle exploite des failles dans la fonction de récompense pour maximiser son score sans vraiment atteindre l'objectif souhaité.

📖
용어

Human-in-the-loop

Approche où les humains participent activement au cycle d'entraînement et d'évaluation du modèle, fournissant des corrections et des feedbacks continus.

🔍

결과를 찾을 수 없습니다