🏠 首页
基准测试
📊 所有基准测试 🦖 恐龙 v1 🦖 恐龙 v2 ✅ 待办事项应用 🎨 创意自由页面 🎯 FSACB - 终极展示 🌍 翻译基准测试
模型
🏆 前 10 名模型 🆓 免费模型 📋 所有模型 ⚙️ 🛠️ 千行代码模式
资源
💬 💬 提示库 📖 📖 AI 词汇表 🔗 🔗 有用链接

AI 词汇表

人工智能完整词典

200
个类别
2,608
个子类别
30,011
个术语
📖
个术语

Differentiable Model-Based RL

Approche d'apprentissage par renforcement où les gradients sont rétropropagés à travers un modèle de l'environnement différentiable pour optimiser directement les politiques.

📖
个术语

Neural Network Dynamics Models

Réseaux de neurones entraînés à prédire l'évolution des états de l'environnement en fonction des actions, permettant la simulation différentiable.

📖
个术语

Differentiable Optimization

Technique où les couches d'optimisation sont différenciables, permettant l'apprentissage end-to-end de processus d'optimisation imbriqués.

📖
个术语

Imagined Experience Replay

Génération de trajectoires synthétiques à travers un modèle différentiable pour enrichir l'expérience d'apprentissage sans interaction réelle.

📖
个术语

Differentiable Planning

Algorithmes de planification où chaque étape est différentiable, permettant l'optimisation continue des plans par descente de gradient.

📖
个术语

Differentiable Simulator

Environnement de simulation implémenté avec des opérations différentiables, permettant le calcul de gradients à travers toute la simulation.

📖
个术语

Policy Gradient Through Model

Méthode calculant les gradients de politique en propageant les récompenses à travers un modèle de l'environnement différentiable.

📖
个术语

Differentiable Environment Models

Modèles de l'environnement conçus spécifiquement pour supporter la rétropropagation des gradients à travers leurs opérations internes.

📖
个术语

Differentiable Game Engines

Moteurs de jeu modifiés pour supporter la différentiation, permettant l'apprentissage par renforcement dans des environnements complexes.

📖
个术语

Neural ODEs in RL

Utilisation d'équations différentielles ordinaires neuronales pour modéliser la dynamique continue de l'environnement de manière différentiable.

📖
个术语

Differentiable Control Theory

Application des principes de contrôle théorique implémentés de manière différentiable pour l'apprentissage end-to-end de contrôleurs.

🔍

未找到结果