🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Модели динамики окружающей среды

Обучение математических моделей, описывающих, как окружающая среда изменяется в зависимости от действий агента.

18 термины
📂
подкатегории

Обучение на основе Мировых Моделей (World Models)

Архитектура, в которой агент строит внутреннее представление мира для симуляции и планирования своих будущих действий.

9 термины
📂
подкатегории

Планирование с помощью поиска по дереву Монте-Карло

Использование алгоритмов поиска по дереву в сочетании с обученными моделями для нахождения оптимальных стратегий.

12 термины
📂
подкатегории

Вероятностные и байесовские модели

Подходы, интегрирующие неопределенность в моделирование окружающей среды для принятия устойчивых решений.

11 термины
📂
подкатегории

Обучение с помощью воображения и мечты

Техники, при которых агент тренируется на мысленно смоделированных сценариях перед действиями в реальности.

16 термины
📂
подкатегории

Вариационные модели

Использование вариационных автоэнкодеров для изучения латентных представлений окружающей среды.

12 термины
📂
подкатегории

Обучение с переносом с использованием моделей

Перенос знаний между средами с использованием изученных моделей в качестве посредников.

20 термины
📂
подкатегории

Графические модели для RL

Представление среды в виде графов для захвата структурных отношений

17 термины
📂
подкатегории

Иерархическое обучение с подкреплением на основе моделей

Иерархическая декомпозиция задач с моделями на разных уровнях временной абстракции

17 термины
📂
подкатегории

Непрерывные и дифференцируемые модели

Моделирование непрерывной динамики, где модель остается дифференцируемой для оптимизации.

19 термины
📂
подкатегории

Калибровка неопределенности и исследование

Техники для количественной оценки и управления неопределенностью модели с целью оптимизации исследования.

16 термины
📂
подкатегории

Обучение с обратным подкреплением на основе моделей

Вывод функций вознаграждения с использованием моделей для генерации правдоподобных траекторий

17 термины
🔍

Результаты не найдены