Непрерывное обучение
A-GEM (Averaged GEM)
Эффективный вариант GEM, который использует усредненное ограничение градиента на всем наборе запомненных примеров, а не индивидуальное ограничение. A-GEM сохраняет гарантии сохранения знаний, значительно снижая вычислительные затраты.
← Назад