Глоссарий ИИ
Полный словарь искусственного интеллекта
Обучение с переносом с использованием моделей
Техника, при которой модель динамики, изученная в исходной среде, используется для ускорения обучения в целевой среде, передавая знание о структуре мира, а не напрямую политики.
Передаваемая модель динамики
Математическое представление переходов состояний среды, разработанное для повторного использования между различными задачами или средами, имеющими общие физические или структурные характеристики.
Обучение с подкреплением на основе моделей
Парадигма, в которой агент создает внутреннюю модель среды для планирования и симуляции траекторий перед действием в реальном мире, тем самым снижая необходимость в дорогостоящих взаимодействиях.
Обобщение модели
Способность модели динамики делать точные прогнозы для состояний или действий, не наблюдаемых во время обучения, существенная для успешного переноса между средами.
Смещение переноса модели
Систематическая ошибка, возникающая при применении модели, изученной в исходной среде, к целевой среде с несколько отличающейся динамикой, требующая техник адаптации.
Мета-обучение моделей
Подход, при котором учатся модели динамики, которые могут быстро адаптироваться к новым средам с небольшим количеством данных, оптимизируя параметры инициализации модели.
Латентное кодирование среды
Компактное представление существенных характеристик среды в латентном пространстве, позволяющее захватывать сходства между различными средами для облегчения переноса моделей.
Калибровка переданной модели
Процесс настройки прогнозов переданной модели для соответствия статистике целевой среды, часто осуществляемый с помощью техник регрессии или байесовской адаптации.
Многомодельный трансфер
Стратегия, использующая набор специализированных моделей, обученных в различных исходных средах, объединённых для формирования надёжной гибридной модели в целевой среде.
Факторизованное пространство задач
Разложение вариаций между средами на независимые факторы, позволяющее выборочный перенос релевантных компонентов модели с адаптацией остальных.
Иерархическое обучение с подкреплением с моделями
Архитектура, в которой модели динамики с различными временными или пространственными масштабами переносятся, обеспечивая эффективное иерархическое планирование в новых средах.
Дистилляция знаний модели
Техника сжатия, при которой большая исходная модель динамики обучает свои предсказания более компактной и переносимой модели, сохраняя способности к обобщению.
Адаптация домена для моделей динамики
Набор методов, направленных на настройку предварительно обученной модели динамики для работы в новом домене, минимизируя расхождение между исходным и целевым распределениями.
Zero-shot перенос моделей
Способность модели динамики функционировать в совершенно новой среде без какой-либо адаптации, благодаря экстремальному обобщению изученных структур.
Графическая модель переходов
Представление динамики среды в виде графа, где узлы - это состояния, а рёбра - вероятностные переходы, что облегчает перенос структуры между схожими средами.
Непрерывное обучение моделей
Парадигма, в которой модель динамики непрерывно обновляется при взаимодействии с новыми средами, сохраняя при этом ранее полученные знания.
Перенос через композицию моделей
Метод, при котором элементарные модели, обученные на простых подзадачах, объединяются для формирования сложной модели, способной управлять новой составной средой.
Эпистемологическая неопределенность в переносе
Количественная оценка неопределенности модели из-за недостатка знаний в неисследованных регионах пространства состояний в исходной среде, что имеет решающее значение для безопасного переноса.
Гибридная нейронно-символическая модель
Архитектура, объединяющая нейронные сети для обучения сложным динамикам с передаваемыми символьными компонентами, представляющими фундаментальные физические ограничения.
Межвременной перенос моделей
Применение изученной модели динамики на определенной временной шкале для эффективной работы на разных временных шкалах в целевой среде.