🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Внутренняя Мотивация

Механизм автономного обучения, при котором агент генерирует внутренние вознаграждения на основе собственного любопытства или стремления к мастерству, независимо от внешних вознаграждений среды.

📖
термины

Внутреннее Вознаграждение

Сигнал вознаграждения, генерируемый самим агентом для поощрения исследования и изучения новых навыков, часто основанный на новизне, удивлении или прогрессе.

📖
термины

Обучение на Основе Любопытства

Подход к обучению, при котором агент мотивирован своим любопытством, измеряя ошибку предсказания своей модели мира для генерации внутренних вознаграждений за исследование.

📖
термины

Расширение Возможностей

Информационная мера, количественно определяющая контроль, который агент может осуществлять над своей средой, используемая как внутреннее вознаграждение для поощрения изучения влиятельных навыков.

📖
термины

Иерархическая Политика

Многоуровневая архитектура принятия решений, где политики высокого уровня выбирают опции или подзадачи, а политики низкого уровня выполняют соответствующие примитивные действия.

📖
термины

Модуль Внутренней Мотивации

Вычислительный компонент, предназначенный для расчета внутренних вознаграждений на основе различных метрик, таких как новизна, расширение возможностей или прогресс в освоении.

📖
термины

Дилемма Исследования-Использования

Фундаментальная проблема в обучении с подкреплением, заключающаяся в балансировании исследования новых возможностей и использования приобретенных знаний.

📖
термины

Мета-Обучение в HRL

Обучение механизмов автоматической адаптации иерархической структуры и внутренних мотиваций для оптимизации эффективности обучения на новых задачах.

📖
термины

Абстрактное представление состояния

Упрощенное представление состояния среды, фиксирующее основную информацию для иерархического принятия решений и обнаружения подцелей.

📖
термины

Генерация целей

Автономный процесс создания промежуточных целей на основе внутренней мотивации для управления исследованием и структурирования иерархического обучения.

📖
термины

Формирование внутреннего вознаграждения

Динамическое изменение функции вознаграждения путем добавления внутренних сигналов для ускорения сходимости и повышения эффективности обучения.

📖
термины

Автономная постановка целей

Способность агента определять собственные цели без внешнего вмешательства, используя механизмы внутренней мотивации для управления своим развитием.

📖
термины

Обнаружение иерархии

Автоматический процесс определения оптимальной иерархической структуры для решения задачи, основанный на анализе переходов состояний и внутренних вознаграждений.

🔍

Результаты не найдены