🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Дифференцируемое обучение с подкреплением на основе модели

Подход обучения с подкреплением, где градиенты обратного распространения ошибки проходят через дифференцируемую модель среды для прямой оптимизации стратегий.

📖
термины

Модели динамики на основе нейронных сетей

Нейронные сети, обученные предсказывать эволюцию состояний среды в зависимости от действий, обеспечивая дифференцируемое моделирование.

📖
термины

Дифференцируемая оптимизация

Техника, в которой слои оптимизации являются дифференцируемыми, что позволяет сквозное обучение вложенных процессов оптимизации.

📖
термины

Воспроизведение воображаемого опыта

Генерация синтетических траекторий с помощью дифференцируемой модели для обогащения обучающего опыта без реального взаимодействия.

📖
термины

Дифференцируемое планирование

Алгоритмы планирования, где каждый шаг является дифференцируемым, что позволяет непрерывную оптимизацию планов с помощью градиентного спуска.

📖
термины

Дифференцируемый симулятор

Среда моделирования, реализованная с помощью дифференцируемых операций, позволяющая вычисление градиентов через всю симуляцию.

📖
термины

Градиент стратегии через модель

Метод вычисления градиентов стратегии путем распространения вознаграждений через дифференцируемую модель среды.

📖
термины

Дифференцируемые модели среды

Модели среды, специально разработанные для поддержки обратного распространения градиентов через их внутренние операции.

📖
термины

Дифференцируемые игровые движки

Модифицированные игровые движки, поддерживающие дифференцирование, позволяющие обучение с подкреплением в сложных средах.

📖
термины

Нейронные ОДУ в ОСП

Использование нейронных обыкновенных дифференциальных уравнений для моделирования непрерывной динамики среды дифференцируемым образом.

📖
термины

Дифференцируемая теория управления

Применение принципов теоретического управления, реализованных дифференцируемым образом, для сквозного обучения контроллеров.

🔍

Результаты не найдены