🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

Model-Based Offline RL

Approche d'apprentissage par renforcement offline qui apprend un modèle dynamique de l'environnement pour générer des données synthétiques et améliorer la politique sans interaction réelle.

📖
المصطلحات

Imagination Rollouts

Trajectoires simulées générées en utilisant le modèle appris de l'environnement pour explorer des états futurs potentiels sans interaction réelle avec l'environnement.

📖
المصطلحات

Conservative Policy Optimization

Algorithme qui pénalise explicitement les politiques qui s'écartent significativement du comportement des données d'entraînement pour éviter les erreurs d'extrapolation.

📖
المصطلحات

Uncertainty Quantification

Technique permettant d'estimer l'incertitude du modèle dynamique dans les régions hors-distribution pour guider l'exploration et éviter les erreurs catastrophiques.

📖
المصطلحات

Ensemble Models

Collection de plusieurs modèles dynamiques entraînés avec différentes initialisations pour estimer l'incertitude épistémique par la variance des prédictions.

📖
المصطلحات

Trajectory Transformers

Architecture transformer qui modélise les trajectoires comme des séquences d'états, actions et récompenses pour prédire les transitions futures en apprentissage offline.

📖
المصطلحات

Offline-to-Online Transfer

Processus de transfert d'une politique apprise offline vers un environnement en ligne pour affinement et adaptation continue avec interaction réelle.

📖
المصطلحات

Model Ensembling

Technique utilisant plusieurs modèles dynamiques pour capturer différentes hypothèses sur la transition d'état et améliorer la robustesse des prédictions.

📖
المصطلحات

Advantage Weighted Regression

Méthode offline qui pondère les actions dans les données d'entraînement selon leur avantage estimé pour améliorer la politique au-delà du simple clonage.

📖
المصطلحات

Out-of-Distribution Detection

Mécanisme pour identifier quand les états générés par le modèle s'écartent significativement de la distribution des données d'entraînement originales.

🔍

لم يتم العثور على نتائج