Глоссарий ИИ
Полный словарь искусственного интеллекта
Обучение с помощью Dyna-Q
Гибридный алгоритм, сочетающий прямое обучение и планирование с использованием изученной модели для генерации моделируемых опытов.
Планирование с помощью поиска по дереву Монте-Карло
Алгоритм исследования дерева решений, использующий случайные симуляции для оценки будущих действий в смоделированной среде.
Обучение с помощью воображения
Техника, использующая внутренние модели для мысленного моделирования сценариев и ускорения обучения без реального взаимодействия.
Модели мира
Архитектура, обучающая сжатому представлению окружающей среды и модели переходов для планирования в латентном пространстве.
Обучение с использованием ансамбля моделей
Подход с использованием нескольких обученных моделей для количественной оценки неопределенности и повышения устойчивости решений.
Обучение через дифференциацию моделей
Метод, который напрямую оптимизирует политики, пропуская градиенты через дифференцируемую модель среды.
Модельное обучение на основе любопытства
Система, использующая ошибки предсказания модели в качестве внутреннего сигнала для наведения исследования окружения.
Обучение на основе иерархии моделей
Многоуровневая структура, объединяющая модели с различными временными масштабами для эффективного планирования на длительных горизонтах.
Обучение путем предсказания траекторий
Предиктивные модели, обучающиеся предвосхищать последовательности будущих состояний для оценки последствий действий до их выполнения.
Обучение на основе модели трансферного обучения
Техника переноса знаний модели между похожими средами для ускорения адаптации к новым задачам.
MuZero
Передовой алгоритм, одновременно обучающий модель перехода, реакции и значения без предварительных знаний о динамике.
Обучение через активное обучение
Стратегия, которая активно выбирает наиболее информативные примеры для повышения эффективности обучения модели.