Обучение с подкреплением на основе модели

📂

подкатегории

Обучение с помощью Dyna-Q

Гибридный алгоритм, сочетающий прямое обучение и планирование с использованием изученной модели для генерации моделируемых опытов.

19 термины

📂

подкатегории

Планирование с помощью поиска по дереву Монте-Карло

Алгоритм исследования дерева решений, использующий случайные симуляции для оценки будущих действий в смоделированной среде.

19 термины

📂

подкатегории

Обучение с помощью воображения

Техника, использующая внутренние модели для мысленного моделирования сценариев и ускорения обучения без реального взаимодействия.

13 термины

📂

подкатегории

Модели мира

Архитектура, обучающая сжатому представлению окружающей среды и модели переходов для планирования в латентном пространстве.

11 термины

📂

подкатегории

Обучение с использованием ансамбля моделей

Подход с использованием нескольких обученных моделей для количественной оценки неопределенности и повышения устойчивости решений.

14 термины

📂

подкатегории

Обучение через дифференциацию моделей

Метод, который напрямую оптимизирует политики, пропуская градиенты через дифференцируемую модель среды.

11 термины

📂

подкатегории

Модельное обучение на основе любопытства

Система, использующая ошибки предсказания модели в качестве внутреннего сигнала для наведения исследования окружения.

12 термины

📂

подкатегории

Обучение на основе иерархии моделей

Многоуровневая структура, объединяющая модели с различными временными масштабами для эффективного планирования на длительных горизонтах.

14 термины

📂

подкатегории

Обучение путем предсказания траекторий

Предиктивные модели, обучающиеся предвосхищать последовательности будущих состояний для оценки последствий действий до их выполнения.

15 термины

📂

подкатегории

Обучение на основе модели трансферного обучения

Техника переноса знаний модели между похожими средами для ускорения адаптации к новым задачам.

13 термины

📂

подкатегории

MuZero

Передовой алгоритм, одновременно обучающий модель перехода, реакции и значения без предварительных знаний о динамике.

13 термины

📂

подкатегории

Обучение через активное обучение

Стратегия, которая активно выбирает наиболее информативные примеры для повышения эффективности обучения модели.

7 термины

Глоссарий ИИ

Обучение с помощью Dyna-Q

Планирование с помощью поиска по дереву Монте-Карло

Обучение с помощью воображения

Модели мира

Обучение с использованием ансамбля моделей

Обучение через дифференциацию моделей

Модельное обучение на основе любопытства

Обучение на основе иерархии моделей

Обучение путем предсказания траекторий

Обучение на основе модели трансферного обучения

MuZero

Обучение через активное обучение

Результаты не найдены