🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Адаптивная скорость обучения

Механизм автоматической настройки скорости обучения во время тренировки, изменяющий величину обновлений параметров в соответствии с локальными характеристиками ландшафта функции потерь.

📖
термины

Историческая сумма квадратов градиентов

Экспоненциальное накопление квадратов прошлых градиентов, используемое в Adagrad для нормализации обновлений параметров, штрафуя частые высокие градиенты и способствуя направлениям с исторически низкими градиентами.

📖
термины

Диагональный масштабирующий множитель

Диагональная матрица, предобуславливающая градиент в Adagrad, каждый элемент которой представляет квадратный корень из накопленной суммы квадратов градиентов для каждого отдельного параметра.

📖
термины

Выпуклая функция потерь

Целевая функция, где любая прямая линия между двумя точками поверхности находится над поверхностью, гарантируя отсутствие локальных минимумов и глобальную сходимость методов градиентного спуска.

📖
термины

Норма градиента

Мера величины вектора градиента, используемая в Adagrad для определения того, подвергался ли параметр значительным обновлениям в истории и поэтому требует адаптивной настройки скорости обучения.

📖
термины

Математическое ожидание квадрата градиента

Статистическая оценка долгосрочного среднего квадратов градиентов, служащая основой для вычисления адаптивных масштабирующих множителей в оптимизаторах семейства Adagrad.

📖
термины

Вектор параметров

Коллекция всех оптимизируемых переменных модели, итеративно обновляемая Adagrad с индивидуально адаптированными скоростями обучения для каждой компоненты вектора.

📖
термины

Плохая обусловленность

Ситуация, когда масштабы градиентов в разных направлениях значительно варьируются, проблема, которую Adagrad решает специально путем динамической адаптации скорости обучения по измерениям.

📖
термины

Смещение коррекции

Механизм в Adam и его вариантах, исправляющий начальную смещенную оценку первого и второго моментов из-за нулевой инициализации экспоненциальных скользящих средних.

📖
термины

Гиперпараметр эпсилон

Маленькая константа, добавляемая в знаменатель в Adagrad и его вариантах для обеспечения численной стабильности, избегая деления на ноль, когда сумма квадратов градиентов очень мала.

🔍

Результаты не найдены