🏠 হোম
বেঞ্চমার্ক
📊 সমস্ত বেঞ্চমার্ক 🦖 ডাইনোসর v1 🦖 ডাইনোসর v2 ✅ টু-ডু লিস্ট অ্যাপস 🎨 সৃজনশীল ফ্রি পেজ 🎯 FSACB - চূড়ান্ত শোকেস 🌍 অনুবাদ বেঞ্চমার্ক
মডেল
🏆 সেরা ১০টি মডেল 🆓 ফ্রি মডেল 📋 সমস্ত মডেল ⚙️ কিলো কোড
রিসোর্স
💬 প্রম্পট লাইব্রেরি 📖 এআই গ্লসারি 🔗 দরকারী লিঙ্ক

এআই গ্লসারি

কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান

238
বিভাগ
3,112
উপ-বিভাগ
36,890
শব্দ
📖
শব্দ

Off-Policy Learning

Méthode d'apprentissage où l'agent apprend une politique optimale tout en suivant une autre politique de comportement, permettant une meilleure exploration.

📖
শব্দ

Target Networks

Réseaux neuronaux dupliqués avec poids mis à jour lentement pour stabiliser l'apprentissage en fournissant des cibles plus consistantes.

📖
শব্দ

Ornstein-Uhlenbeck Process

Processus stochastique utilisé pour générer du bruit temporellement corrélé dans les actions, favorisant une exploration efficace en espaces continus.

📖
শব্দ

Continuous Action Space

Environnement où les actions peuvent prendre n'importe quelle valeur dans un intervalle continu, nécessitant des algorithmes adaptés contrairement aux actions discrètes.

📖
শব্দ

Neural Network Function Approximation

Utilisation de réseaux neuronaux pour approximer des fonctions complexes comme les politiques ou les fonctions de valeur en apprentissage par renforcement.

📖
শব্দ

Soft Update

Méthode de mise à jour progressive des réseaux cibles utilisant un coefficient tau (τ) pour mélanger lentement les poids des réseaux principaux et cibles.

📖
শব্দ

Actor Network

Réseau neuronal apprenant à mapper directement les états aux actions optimales dans un espace d'action continu.

📖
শব্দ

Deterministic Policy

Politique qui associe une action spécifique à chaque état, contrairement aux politiques stochastiques qui retournent des distributions de probabilités.

📖
শব্দ

Action Noise

Bruit ajouté aux actions produites par l'acteur pour encourager l'exploration de l'espace d'action continu durant l'entraînement.

🔍

কোন ফলাফল পাওয়া যায়নি