Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Mémoire Sémantique
Base de connaissances structurée stockant des faits et des relations générales sur l'environnement, indépendamment des expériences spécifiques, pour guider le raisonnement et la planification de l'agent.
Read-Write Memory
Fonction de Récupération (Retrieval Function)
Mécanisme, souvent basé sur l'attention, qui calcule la pertinence de chaque élément stocké dans la mémoire par rapport à l'état ou à la requête actuelle de l'agent pour sélectionner les informations à lire.
Gated Recurrent Unit with Memory (GRU-M)
Variante des GRU où les portes internes contrôlent non seulement le flux d'information dans l'état caché mais aussi les opérations de lecture et d'écriture dans une mémoire externe dédiée.
Agent Réflectif
Agent qui, avant d'agir, effectue une séquence d'étapes de 'raisonnement' ou de 'réflexion' en lisant et écrivant dans sa mémoire pour planifier une meilleure stratégie, notamment dans les environnements complexes.
Mémoire à Accès Contentieux (Content-Addressable Memory)
Type de mémoire où les données sont récupérées en fonction de leur contenu ou de leur similarité avec une requête, plutôt que par une adresse physique fixe, favorisant une recherche associative.
Inférence d'État (State Inference)
Processus par lequel un agent dans un POMDP met à jour sa croyance sur l'état caché de l'environnement en se basant sur l'historique des observations, des actions et des récompenses.
Mémoire de Travail (Working Memory)
Composante de la mémoire externe à capacité limitée utilisée pour stocker temporairement les informations pertinentes pour la tâche en cours, facilitant le raisonnement et la prise de décision immédiate.
Relational Memory Core (RMC)
Module de mémoire utilisant un mécanisme d'attention multi-têtes pour modéliser les relations entre les différents emplacements de la mémoire, permettant un raisonnement plus complexe sur les informations stockées.
Mémoire de Trajectoire
Stockage explicite des trajectoires complètes ou partielles (séquences d'états, actions, récompenses) pour permettre à l'agent de réévaluer ses expériences passées ou d'imiter des comportements réussis.