Offline Multi-Task Reinforcement Learning
Multi-Task Offline Evaluation Metrics
Mesures spécifiques évaluant la performance des politiques multi-tâches sans interaction, comme le FQE multi-tâches ou l'importance sampling pondéré.
← Retour