قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

📖

المصطلحات

Sequence Modeling

Approche qui formalise l'apprentissage par renforcement comme un problème de modélisation de séquences, où les états, actions et récompenses sont traités comme des tokens dans une séquence temporelle.

📖

المصطلحات

Temporal Difference Transformer

Variante de transformer qui intègre les principes de différence temporelle dans l'architecture d'attention, combinant apprentissage séquentiel et mise à jour bootstrap des estimations de valeur.

📖

المصطلحات

Trajectory Conditioning

Technique où le générateur de trajectoires est conditionné sur des segments de trajectoire partiels ou des objectifs spécifiques, permettant un contrôle précis du comportement généré.

📖

المصطلحات

Multi-step Prediction

Capacité des modèles transformer à prédire plusieurs étapes futures d'une trajectoire simultanément, améliorant la cohérence à long terme des séquences état-action-récompense générées.

📖

المصطلحات

Distributional RL

Extension de l'apprentissage par renforcement qui modélise la distribution complète des retours plutôt que seulement leur espérance, capturant l'incertitude dans les prédictions de trajectoire.

📖

المصطلحات

Attention-based Trajectory Embedding

Représentation vectorielle des trajectoires obtenue par mécanismes d'attention, capturant les dépendances temporelles complexes entre états, actions et récompenses successives.

🔍

قاموس الذكاء الاصطناعي

Sequence Modeling

Temporal Difference Transformer

Trajectory Conditioning

Multi-step Prediction

Distributional RL

Attention-based Trajectory Embedding

لم يتم العثور على نتائج