🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Hierarchical Actor-Critic (HAC)

Architecture d'apprentissage par renforcement combinant des acteurs et critiques à multiples niveaux hiérarchiques pour résoudre des tâches complexes par décomposition temporelle.

📖
términos

High-level Policy

Politique de décision située au sommet de la hiérarchie qui sélectionne des sous-objectifs ou des options pour guider les politiques de niveau inférieur.

📖
términos

Low-level Policy

Politique de base dans la hiérarchie qui exécute des actions primitives pour atteindre les sous-objectifs définis par la politique de niveau supérieur.

📖
términos

Subgoal

Objectif intermédiaire défini par un agent de niveau supérieur que les agents de niveau inférieur doivent atteindre pour progresser vers l'objectif final.

📖
términos

Intra-option Policy

Politique qui détermine les actions à exécuter à chaque étape temporelle lorsqu'une option spécifique est active dans le cadre hiérarchique.

📖
términos

Feudal Networks (FuN)

Architecture hiérarchique inspirée du féodalisme où un manager définit des directions de but et des workers exécutent des actions pour atteindre ces buts.

📖
términos

Controller

Agent de niveau inférieur qui exécute des actions primitives pour accomplir les sous-objectifs spécifiés par le méta-contrôleur.

📖
términos

Hierarchical Deep Deterministic Policy Gradient (H-DDPG)

Extension de l'algorithme DDPP intégrant une structure hiérarchique d'acteurs-critiques pour l'apprentissage dans des espaces d'action continus.

📖
términos

Multi-level Actor-Critic

Architecture où chaque niveau hiérarchique possède sa propre paire acteur-critique optimisée pour des horizons temporels différents.

📖
términos

Hierarchical Q-Learning

Variante du Q-learning où les valeurs Q sont calculées à différents niveaux hiérarchiques pour évaluer les options et les actions primitives.

📖
términos

Subtask Decomposition

Processus de division automatique d'une tâche complexe en sous-tâches plus simples et gérables pour l'apprentissage hiérarchique.

📖
términos

End-to-end Hierarchical Learning

Approche où toute la hiérarchie de politiques est entraînée simultanément sans pré-décomposition manuelle des tâches.

🔍

No se encontraron resultados