🏠 Главная
Бенчмарки
📊 Все бенчмарки 🦖 Динозавр v1 🦖 Динозавр v2 ✅ Приложения To-Do List 🎨 Творческие свободные страницы 🎯 FSACB - Ультимативный показ 🌍 Бенчмарк перевода
Модели
🏆 Топ-10 моделей 🆓 Бесплатные модели 📋 Все модели ⚙️ Режимы Kilo Code
Ресурсы
💬 Библиотека промптов 📖 Глоссарий ИИ 🔗 Полезные ссылки

Глоссарий ИИ

Полный словарь искусственного интеллекта

235
категории
2 988
подкатегории
33 628
термины
📖
термины

Разделенная L2-регуляризация

Разделение уменьшения весов от обновления градиента для применения регуляризации независимо от этапа оптимизации.

📖
термины

Гиперпараметры beta1 и beta2

Коэффициенты, управляющие соответственно экспоненциальным затуханием моментов первого и второго порядка в алгоритме AdamW.

📖
термины

Момент первого порядка

Экспоненциальное скользящее среднее градиентов, захватывающее среднее направление спуска для ускорения сходимости в каньонах ошибок.

📖
термины

Момент второго порядка

Экспоненциальное скользящее среднее квадратов градиентов, оценивающее дисперсию для адаптации скорости обучения в соответствии с локальной кривизной.

📖
термины

Эпсилон стабилизации

Маленькая константа, добавляемая к знаменателю для избежания деления на ноль и обеспечения численной стабильности при нормализации градиентов.

📖
термины

Асимптотическая сходимость

Теоретическое свойство, гарантирующее, что алгоритм достигает критической точки, когда количество итераций стремится к бесконечности при определенных условиях.

📖
термины

Разложение градиента

Векторное разделение градиента на компоненты уменьшения весов и фактического обновления в реализации AdamW.

📖
термины

Холодный запуск смещения

Проблема смещенной оценки моментов на первых итерациях из-за инициализации нулями, исправляемая факторами смещения AdamW.

📖
термины

Фактор затухания веса

Параметр лямбда, контролирующий интенсивность разделенной регуляризации L2, применяемой независимо к каждому обновлению веса.

📖
термины

Адаптивная нормализация

Деление градиента на квадратный корень из его момента второго порядка для нормализации амплитуды обновлений в соответствии с историей градиентов.

🔍

Результаты не найдены