Глоссарий ИИ
Полный словарь искусственного интеллекта
Клонирование поведения
Прямое обучение стратегии путём минимизации ошибки между действиями агента и экспертными демонстрациями.
Обучение с обратным подкреплением
Вывод функции вознаграждения из экспертных демонстраций для последующего обучения оптимальной политике
Генеративное состязательное обучение с имитацией
Использование состязательных сетей для различения поведения агента и экспертных демонстраций.
Агрегация данных DAgger
Итеративный сбор данных путем запроса эксперта о состояниях, посещаемых текущей политикой
Офлайн обучение имитации
Обучение на основе фиксированного набора демонстраций без дополнительного взаимодействия со средой.
Обучение с подражанием в реальном времени
Непрерывное обучение с взаимодействием в реальном времени и обновлениями, основанными на новых демонстрациях.
Имитация через наблюдение
Обучение путем наблюдения только состояний и траекторий без доступа к действиям эксперта
Иерархическое обучение по имитации
Декомпозиция сложных задач на подзадачи с обучением по имитации на различных уровнях абстракции.
Обучение имитации за один пример
Способность имитировать новую задачу после наблюдения одной демонстрации.
Мета-обучение с подражанием
Быстрое обучение выполнению новых задач путем подражания через опыт с несколькими задачами
Мультимодальное обучение с подражанием
Управление демонстрациями с несколькими допустимыми решениями и обучение мультимодальным политикам.
Имитация с частичными наблюдениями
Обучение путем имитации, когда демонстрации лишь частично охватывают пространство состояний