Мета-обучение в обучении с подкреплением
Inner Loop Optimization
Процесс быстрой адаптации параметров модели на конкретной задаче с использованием нескольких шагов градиента во время метаобучения.
← Назад