🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Опции Саттона

Фундаментальная концепция, введенная Саттоном, определяющая временные расширенные действия с собственными политиками, условиями входа и функциями завершения.

15 термины
📂
подкатегории

MAXQ Декомпозиция

Иерархический подход декомпозиции, основанный на задачах, который структурирует проблемы в графы подзадач с распределением ценности.

15 термины
📂
подкатегории

HAM (Иерархические Абстрактные Машины)

Иерархические конечные автоматы, определяющие абстрактные политики и подполитики для управления обучением.

15 термины
📂
подкатегории

FeUdal Networks

Архитектура, вдохновленная феодализмом, с менеджерами, определяющими цели, и работниками, выполняющими низкоуровневые действия.

8 термины
📂
подкатегории

Целеориентированное обучение с подкреплением

Обучение с подкреплением, где политики обусловлены подцелями для облегчения иерархической декомпозиции.

15 термины
📂
подкатегории

Открытие подцелей

Автоматические методы для выявления и обнаружения релевантных подцелей в пространстве состояний без человеческого контроля.

18 термины
📂
подкатегории

Временная абстракция

Методы, позволяющие абстрагировать решения на различных временных масштабах для управления длительными временными горизонтами.

19 термины
📂
подкатегории

Многозадачное HRL

Иерархическое обучение одновременно нескольким задачам, разделяющим общие подзадачи для эффективного переноса.

14 термины
📂
подкатегории

Внутренняя мотивация в HRL

Использование внутренних вознаграждений для автоматического обнаружения релевантных иерархических структур.

13 термины
📂
подкатегории

Метаобучение в HRL

Метаобученческие подходы для автоматической адаптации иерархических структур к новым задачам и средам.

13 термины
📂
подкатегории

Методы обнаружения опций

Специфические алгоритмы для автоматического обнаружения эффективных опций на основе плотности, достижимости или узких мест.

14 термины
📂
подкатегории

Иерархический градиент политики

Методы градиента политики, адаптированные к иерархическим структурам с одновременной оптимизацией иерархических уровней.

10 термины
📂
подкатегории

Абстракция состояния в HRL

Методы абстракции состояния для упрощения представлений на различных иерархических уровнях и ускорения обучения.

12 термины
📂
подкатегории

Функции завершения

Функции, определяющие момент завершения опций и подзадач, ключевые для эффективности иерархий.

15 термины
📂
подкатегории

Иерархический Актор-Критик

Архитектура актор-критик с многоуровневыми акторами и критиками, скоординированными для иерархического обучения.

12 термины
🔍

Результаты не найдены