🏠 Ana Sayfa
Benchmarklar
📊 Tüm Benchmarklar 🦖 Dinozor v1 🦖 Dinozor v2 ✅ To-Do List Uygulamaları 🎨 Yaratıcı Serbest Sayfalar 🎯 FSACB - Nihai Gösteri 🌍 Çeviri Benchmarkı
Modeller
🏆 En İyi 10 Model 🆓 Ücretsiz Modeller 📋 Tüm Modeller ⚙️ Kilo Code
Kaynaklar
💬 Prompt Kütüphanesi 📖 YZ Sözlüğü 🔗 Faydalı Bağlantılar

YZ Sözlüğü

Yapay Zekanın tam sözlüğü

162
kategoriler
2.032
alt kategoriler
23.060
terimler
📖
terimler

Approximation de fonction

Technique permettant d'estimer des fonctions de valeur ou de politique dans des espaces d'états continus en utilisant des paramètres ajustables plutôt que des tables explicites.

📖
terimler

Réseaux de neurones d'approximation

Architectures neuronales utilisées comme approximateurs universels pour représenter des fonctions Q ou politiques dans des espaces à grande dimension.

📖
terimler

Méthodes tabulaires étendues

Extension des algorithmes de RL classiques comme Q-learning ou SARSA aux espaces continus via l'approximation de fonction plutôt que des tables de valeurs.

📖
terimler

Espaces d'états continus

Environnements où les états peuvent prendre une infinité de valeurs dans un intervalle continu, nécessitant une généralisation plutôt que mémorisation.

📖
terimler

Deep Q-Network (DQN)

Architecture de RL combinant Q-learning avec des réseaux de neurones profonds pour gérer des espaces d'états à haute dimension comme les pixels d'images.

📖
terimler

Approximation de fonction de valeur

Méthode consistant à estimer V(s) ou Q(s,a) à l'aide d'un approximateur paramétré θ pour généraliser à travers des états similaires.

📖
terimler

Généralisation en RL

Capacité d'un agent à transférer ses connaissances apprises sur des états observés à des états non vus mais similaires.

📖
terimler

Malédiction de la dimensionnalité

Phénomène où la complexité computationnelle croît exponentiellement avec le nombre de dimensions de l'espace d'états.

📖
terimler

Extraction de caractéristiques

Processus de transformation des états bruts en représentations informatives adaptées à l'approximation de fonction en RL.

📖
terimler

Approximation linéaire

Méthode d'approximation où la fonction de valeur est représentée comme combinaison linéaire de caractéristiques φ(s) avec poids w.

📖
terimler

Fonctions de base radiales

Fonctions d'activation localisées dans l'espace d'états, utilisées comme approximateurs universels en RL continu.

📖
terimler

Stabilité de convergence

Propriété garantissant que l'algorithme d'approximation converge vers une solution optimale sous certaines conditions.

🔍

Sonuç bulunamadı