🏠 홈
벤치마크
📊 모든 벤치마크 🦖 공룡 v1 🦖 공룡 v2 ✅ 할 일 목록 앱 🎨 창의적인 자유 페이지 🎯 FSACB - 궁극의 쇼케이스 🌍 번역 벤치마크
모델
🏆 톱 10 모델 🆓 무료 모델 📋 모든 모델 ⚙️ 킬로 코드 모드
리소스
💬 프롬프트 라이브러리 📖 AI 용어 사전 🔗 유용한 링크

AI 용어집

인공지능 완전 사전

162
카테고리
2,032
하위 카테고리
23,060
용어
📂
하위 카테고리

Q-Learning Épisodique

Algorithme d'apprentissage par renforcement off-policy qui apprend la fonction valeur-action à partir d'épisodes complets.

15 용어
📂
하위 카테고리

SARSA Épisodique

Algorithme on-policy qui met à jour les valeurs Q en suivant la politique actuelle à travers les épisodes.

15 용어
📂
하위 카테고리

Méthodes Monte Carlo

Techniques d'apprentissage basées sur l'échantillonnage complet d'épisodes pour estimer les valeurs.

16 용어
📂
하위 카테고리

Learning Temporel Différentiel

Combinaison des approches Monte Carlo et du bootstrapping pour l'apprentissage épisodique.

11 용어
📂
하위 카테고리

Policy Gradient Épisodique

Optimisation directe des paramètres de politique en utilisant les gradients des retours épisodiques.

8 용어
📂
하위 카테고리

Actor-Critic Épisodique

Architecture hybride combinant un acteur (politique) et un critique (évaluateur de valeur) pour l'apprentissage épisodique.

16 용어
📂
하위 카테고리

Exploration vs Exploitation

Dilemme fondamental dans la gestion des épisodes entre découvrir de nouvelles actions et exploiter les connaissances acquises.

13 용어
📂
하위 카테고리

Reward Shaping Épisodique

Modification des fonctions de récompense pour accélérer la convergence dans les cadres épisodiques.

17 용어
📂
하위 카테고리

Approximation de Fonction

Utilisation de réseaux de neurones ou autres approximateurs pour généraliser à travers les états épisodiques.

12 용어
📂
하위 카테고리

Multi-Armed Bandits Épisodiques

Cas simplifié d'apprentissage par renforcement avec des épisodes à une décision.

7 용어
📂
하위 카테고리

Apprentissage Hiérarchique

Décomposition des tâches complexes en sous-épisodes hiérarchiques pour faciliter l'apprentissage.

14 용어
📂
하위 카테고리

Curriculum Learning

Séquencement progressif des épisodes d'entraînement pour optimiser l'apprentissage.

13 용어
📂
하위 카테고리

Experience Replay Épisodique

Stockage et réutilisation sélective des expériences épisodiques pour améliorer l'efficacité d'apprentissage.

16 용어
📂
하위 카테고리

Credit Assignment Épisodique

Mécanismes pour attribuer correctement les récompenses aux actions au sein d'un épisode.

17 용어
📂
하위 카테고리

Meta-Learning Épisodique

Apprentissage à apprendre rapidement sur de nouvelles tâches en utilisant des méta-épisodes.

11 용어
🔍

결과를 찾을 수 없습니다