🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

RL^2 (Reinforcement Learning Squared)

Framework méta-apprentissage où le réseau neuronal lui-même implémente un algorithme d'apprentissage par renforcement, apprenant à s'adapter à de nouvelles tâches à partir de séquences de transitions.

📖
المصطلحات

Proximal Meta-Policy Optimization (ProMP)

Algorithme méta-apprentissage basé sur PPO qui maintient un ensemble de méta-paramètres optimisés pour une adaptation rapide aux nouvelles tâches par renforcement.

📖
المصطلحات

Inner Loop/Outer Loop

Structure d'optimisation à deux niveaux où la boucle interne adapte aux tâches spécifiques et la boucle externe méta-optimize les paramètres pour une meilleure adaptation.

📖
المصطلحات

Exploration Strategies

Mécanismes permettant à l'agent méta-apprenant d'explorer efficacement de nouvelles tâches pour collecter rapidement des informations pertinentes pour l'adaptation.

📖
المصطلحات

Few-shot Reinforcement Learning

Scénario où l'agent doit apprendre une nouvelle tâche avec très peu d'exemples ou d'interactions, typiquement 1 à 10 épisodes.

📖
المصطلحات

Meta-Actor-Critic

Architecture qui combine méta-apprentissage avec les méthodes acteur-critique, où les deux composants sont optimisés pour une adaptation rapide aux nouvelles tâches.

📖
المصطلحات

Task-Agnostic Exploration

Approche d'exploration qui ne nécessite pas de connaissance préalable de la distribution des tâches, permettant une adaptation à des tâches inattendues.

📖
المصطلحات

Meta-Value Function

Fonction de valeur paramétrée pour estimer les performances attendues d'une politique adaptée à une nouvelle tâche donnée.

🔍

لم يتم العثور على نتائج