🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📂
подкатегории

Клонирование поведения

Прямое обучение стратегии путём минимизации ошибки между действиями агента и экспертными демонстрациями.

17 термины
📂
подкатегории

Обучение с обратным подкреплением

Вывод функции вознаграждения из экспертных демонстраций для последующего обучения оптимальной политике

14 термины
📂
подкатегории

Генеративное состязательное обучение с имитацией

Использование состязательных сетей для различения поведения агента и экспертных демонстраций.

18 термины
📂
подкатегории

Агрегация данных DAgger

Итеративный сбор данных путем запроса эксперта о состояниях, посещаемых текущей политикой

17 термины
📂
подкатегории

Офлайн обучение имитации

Обучение на основе фиксированного набора демонстраций без дополнительного взаимодействия со средой.

13 термины
📂
подкатегории

Обучение с подражанием в реальном времени

Непрерывное обучение с взаимодействием в реальном времени и обновлениями, основанными на новых демонстрациях.

15 термины
📂
подкатегории

Имитация через наблюдение

Обучение путем наблюдения только состояний и траекторий без доступа к действиям эксперта

15 термины
📂
подкатегории

Иерархическое обучение по имитации

Декомпозиция сложных задач на подзадачи с обучением по имитации на различных уровнях абстракции.

17 термины
📂
подкатегории

Обучение имитации за один пример

Способность имитировать новую задачу после наблюдения одной демонстрации.

11 термины
📂
подкатегории

Мета-обучение с подражанием

Быстрое обучение выполнению новых задач путем подражания через опыт с несколькими задачами

20 термины
📂
подкатегории

Мультимодальное обучение с подражанием

Управление демонстрациями с несколькими допустимыми решениями и обучение мультимодальным политикам.

19 термины
📂
подкатегории

Имитация с частичными наблюдениями

Обучение путем имитации, когда демонстрации лишь частично охватывают пространство состояний

10 термины
🔍

Результаты не найдены