Глоссарий ИИ
Полный словарь искусственного интеллекта
MAML (Model-Agnostic Meta-Learning)
Алгоритм мета-обучения, который изучает начальные параметры модели, позволяющие быстро адаптироваться к новым задачам с несколькими примерами с помощью градиентной оптимизации.
Meta-LSTM
Вариант LSTM, который мета-обучает собственные параметры обновления, обеспечивая динамическую адаптацию весов модели в зависимости от характеристик, специфичных для каждой задачи.
SNAIL (Simple Neural Attentive Learner)
Гибридная архитектура, объединяющая временные свёртки и механизмы внимания для обучения на последовательностях примеров и быстрой адаптации к новым задачам.
Meta-SGD
Расширение MAML, которое обучает не только начальные параметры, но и скорости обучения, специфичные для каждого параметра, для более гибкой адаптации к новым задачам.
Reptile
Упрощённый алгоритм мета-обучения, выполняющий интерполяцию между начальными весами и весами после нескольких шагов оптимизации на текущей задаче.
TADAM (Task-Dependent Adaptive Metric)
Метод, объединяющий прототипные сети с модулем внимания, учитывающим задачу, для динамической адаптации пространства вложений в зависимости от характеристик каждой задачи.
LEAP (Learning to Evaluate)
Фреймворк мета-обучения, который изучает функцию оценки для сравнения моделей на различных задачах, напрямую оптимизируя показатели мета-обобщения, а не потери по отдельным задачам.
L2L (Learning to Learn)
Парадигма, в которой нейронный мета-оптимизатор учится обновлять параметры другой сети, открывая адаптивные алгоритмы оптимизации, специфичные для каждой проблемы.
R2D2 (Recursive Reward Decomposition)
Метод мета-обучения с подкреплением, использующий иерархическую декомпозицию вознаграждений для обучения переиспользуемых политик на различных задачах.
Meta-Transfer Learning
Подход, объединяющий мета-обучение и трансферное обучение для изучения передаваемых представлений с сохранением способности быстрой адаптации к новым распределениям данных.
Meta-RL (Meta-Reinforcement Learning)
Область, в которой агент учится быстро адаптирующимся политикам для новых задач с подкреплением, используя закономерности в различных средах.