Агрегация данных DAgger
Адаптивная агрегация
Вариант DAgger, который динамически настраивает соотношение экспертных действий и действий текущей политики. Эта адаптация позволяет сбалансировать исследование и использование во время обучения.
← Назад