🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Историческое накопление

Процесс хранения и накопления информации о прошлых градиентах для динамической адаптации скоростей обучения. В AdaDelta это накопление ограничено скользящим окном, чтобы избежать бесконечного убывания скорости обучения.

📖
термины

Коэффициент затухания

Параметр (обычно между 0.9 и 0.999), контролирующий скорость, с которой влияние прошлых градиентов экспоненциально уменьшается. Этот фактор определяет эффективный размер скользящего окна в адаптивных алгоритмах, таких как AdaDelta.

📖
термины

Нормализация градиента

Процесс масштабирования градиентов с использованием исторической статистики для стабилизации обучения. AdaDelta нормализует градиенты, деля их на квадратный корень из скользящего среднего их квадратов.

📖
термины

Согласованные единицы

Основной принцип AdaDelta, согласно которому обновления имеют те же единицы измерения, что и параметры, что устраняет необходимость в глобальной скорости обучения. Этот подход использует соотношение между скользящими средними прошлых обновлений и текущих градиентов.

📖
термины

Масштабирование параметров

Процесс динамической настройки амплитуды обновлений для каждого параметра в зависимости от их истории градиентов. AdaDelta использует скользящее среднее прошлых обновлений для определения этого адаптивного масштаба.

📖
термины

Условия сходимости

Математические критерии, гарантирующие, что алгоритм оптимизации достигнет локального или глобального оптимума. Адаптивные алгоритмы, такие как AdaDelta, изменяют эти условия, динамически меняя направление и величину шагов оптимизации.

📖
термины

Состояние оптимизации

Дополнительная информация, хранящаяся адаптивными алгоритмами для вычисления будущих обновлений. AdaDelta поддерживает два состояния: скользящее среднее квадратов градиентов и скользящее среднее квадратов обновлений.

📖
термины

Гиперпараметр Rho

Единственный параметр AdaDelta (обычно устанавливается на 0.95), контролирующий скорость экспоненциального затухания скользящего окна. Этот параметр определяет баланс между недавней и исторической информацией в вычислениях обновлений.

🔍

Результаты не найдены