🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles

Glosario IA

El diccionario completo de la Inteligencia Artificial

231
categorías
2.999
subcategorías
35.535
términos
📖
términos

Multi-level Policy Optimization

Processus d'optimisation coordonné ajustant les paramètres de plusieurs couches de politiques hiérarchiques en utilisant des gradients synchronisés pour maximiser la récompense globale.

📖
términos

Nested Policy Networks

Architecture de réseaux de neurones où les politiques de bas niveau sont imbriquées dans des politiques de haut niveau, permettant une décomposition hiérarchique des décisions et des actions.

📖
términos

Option Framework

Formalisation mathématique des comportements temporaires étendus dans les hiérarchies, où chaque option combine une politique intra-option, une condition d'initiation et de terminaison.

📖
términos

Sub-policy Selection

Mécanisme par lequel la politique de haut niveau choisit dynamiquement quelle sous-politique activer en fonction de l'état courant et des objectifs à atteindre.

📖
términos

Primitive Actions

Actions fondamentales de plus bas niveau exécutées directement dans l'environnement, constituant les briques de base des comportements complexes construits par la hiérarchie.

📖
términos

Hierarchical Advantage Estimation

Technique d'estimation des avantages tenant compte de la structure hiérarchique, évaluant la contribution de chaque niveau à l'amélioration globale des performances.

📖
términos

Cross-level Gradient Flow

Mécanisme de propagation des gradients à travers les différents niveaux hiérarchiques, assurant une optimisation coordonnée et stable de l'ensemble de l'architecture.

📖
términos

Hierarchical Entropy Regularization

Technique de régularisation appliquant des pénalités d'entropie différenciées selon les niveaux hiérarchiques pour équilibrer exploration et exploitation à chaque échelle.

📖
términos

Multi-timescale Learning

Paradigme d'apprentissage où différents niveaux hiérarchiques opèrent à des échelles temporelles distinctes, permettant une gestion efficace des décisions court et long terme.

📖
términos

Hierarchical Value Functions

Fonctions de valeur structurées hiérarchiquement estimant les rendements attendus à différents niveaux d'abstraction temporelle pour guider l'apprentissage des politiques.

🔍

No se encontraron resultados