🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar

YZ Sözlüğü

Yapay Zekanın tam sözlüğü

162
kategoriler
2.032
alt kategoriler
23.060
terimler
📖
terimler

Apprentissage par Renforcement Hiérarchique Basé sur Modèles (HRL-MB)

Paradigme d'apprentissage par renforcement qui intègre une structure hiérarchique de politiques et un modèle de l'environnement pour accélérer l'apprentissage et améliorer le transfert de compétences.

📖
terimler

Décomposition Hiérarchique des Tâches

Méthode consistant à diviser un problème complexe en sous-tâches plus simples organisées en une hiérarchie, où chaque niveau gère des actions à une échelle temporelle différente.

📖
terimler

Modèle de Transition à Échelles Multiples

Modèle environnemental qui prédit les transitions d'état à différents niveaux d'abstraction temporelle, correspondant aux divers niveaux de la hiérarchie de contrôle.

📖
terimler

Fonction de Termination d'Option

Fonction probabiliste qui détermine quand une option (sous-politique) doit se terminer et céder le contrôle au niveau hiérarchique supérieur.

📖
terimler

Politique de Haut-Niveau (Meta-contrôleur)

Politique située au sommet de la hiérarchie qui sélectionne et active les options (sous-politiques) appropriées en fonction de l'état courant et des objectifs à long terme.

📖
terimler

Modèle de Prédiction d'Option

Composant qui prédit les conséquences (états terminaux, récompenses) de l'exécution d'une option à partir d'un état donné, sans simuler chaque action primitive.

📖
terimler

Graphe de Tâches Hiérarchique (HTN)

Formalisme de représentation structurant les tâches en réseau hiérarchique où les nœuds sont des tâches et les arcs représentent les relations de décomposition.

📖
terimler

Apprentissage par Renforcement Basé sur Modèles avec Options

Approche combinant l'utilisation d'un modèle environnemental pour la planification et une structure d'options pour l'abstraction temporelle des actions.

📖
terimler

Multi-Resolution World Model

Environmental model representing the world at different spatial and temporal granularities to adapt to the needs of each hierarchical level.

📖
terimler

Option Initiation Policy

Set of states from which a particular option can be activated and begin its execution, defining the validity domain of the sub-policy.

📖
terimler

Hierarchical Monte Carlo Planning (HMCP)

Tree search algorithm that performs simulations using options as basic actions, allowing more efficient exploration of the policy space.

📖
terimler

Temporal Decoupling of Decisions

Principle according to which decisions are made at different frequencies depending on their hierarchical level, with higher levels intervening less frequently.

📖
terimler

Hierarchical Reward Model

Reward structure where each hierarchical level has its own reward function, potentially aligned with specific sub-objectives at that level.

📖
terimler

Terminal Option Leaves

Options located at the base of the hierarchy that directly execute primitive actions on the environment without delegation to sub-options.

📖
terimler

Option-based Model Learning

Learning process where the environmental model is trained to predict the effects of options rather than primitive actions, requiring less data.

📖
terimler

Abstract Option Space

Set of all options available at a given hierarchical level, constituting the action space for the upper-level policy.

📖
terimler

Hierarchical Credit Backpropagation

Credit attribution mechanism that distributes rewards and responsibilities across different levels of the policy hierarchy.

🔍

Sonuç bulunamadı