RL, основанное на любопытстве
Go-Explore
Алгоритм исследования, который явно запоминает посещенные состояния с соответствующими траекториями, а затем систематически исследует от этих опорных точек для обнаружения новых областей.
← Назад