Стохастические методы второго порядка

📖

термины

Стохастический метод Ньютона

Алгоритм оптимизации, который стохастически аппроксимирует матрицу Гессе для ускорения сходимости, объединяя вычислительную эффективность SGD со свойствами сходимости второго порядка.

📖

термины

L-BFGS (алгоритм с ограниченной памятью)

Квазиньютоновский вариант, который аппроксимирует обратную матрицу Гессе, используя только последние m итераций, что значительно снижает требования к памяти, сохраняя при этом преимущества методов второго порядка.

📖

термины

K-FAC (Кронекеровская аппроксимация кривизны)

Метод оптимизации второго порядка, который аппроксимирует матрицу Фишера произведением Кронекера меньших матриц, обеспечивая эффективность вычислений для глубоких нейронных сетей.

📖

термины

Естественный градиентный спуск

Алгоритм оптимизации, использующий информационную метрику Фишера в качестве предобуславливателя, что гарантирует инвариантность сходимости относительно репараметризации модели.

📖

термины

AdaHessian

Адаптивный оптимизатор, который оценивает диагональ матрицы Гессе с использованием аппроксимации Хатчинсона, адаптируя скорость обучения для каждого параметра на основе локальной кривизны.

📖

термины

Оптимизатор Shampoo

Оптимизатор второго порядка, который предобуславливает градиенты, используя аппроксимации матриц Кронекера для тензоров весов, адаптируясь к структуре параметров модели.

📖

термины

LAMB (построчно-адаптивный оптимизатор моментов)

Адаптивный оптимизатор, который настраивает скорость обучения по слоям, используя нормы весов и градиентов, сочетая преимущества Adam с адаптацией к структуре сети.

📖

термины

Оптимизатор Sophia

Метод оптимизации второго порядка, который сочетает оценки диагональной матрицы Гессе со стохастическим управлением импульсом, динамически адаптируя направление обновления в зависимости от локальной кривизны.

📖

термины

Метод Ньютона с подвыборкой

Вариант метода Ньютона, который использует подвыборки данных для оценки градиента и гессиана, снижая вычислительную сложность при сохранении свойств локальной квадратичной сходимости.

📖

термины

Стохастический квазиньютоновский метод

Класс алгоритмов, которые поддерживают стохастически обновляемую аппроксимацию обратной матрицы Гессе, балансируя вычислительную сложность и скорость сходимости.

📖

термины

Диагональный метод Гаусса-Ньютона

Аппроксимация гессиана, использующая только диагональные элементы матрицы Гаусса-Ньютона, что значительно снижает вычислительные затраты для задач большой размерности.

📖

термины

TNSR (Тензорная нормализованная регуляризация второго порядка)

Метод, применяющий регуляризацию второго порядка путем нормализации тензоров градиентов в соответствии с оценками кривизны, что стабилизирует обучение глубоких сетей.

📖

термины

Онлайн-шаг Ньютона

Алгоритм онлайн-оптимизации, который поддерживает аппроксимацию обратной матрицы Гессе для динамической адаптации обновлений параметров на основе последовательных наблюдений.

📖

термины

Стохастический рекурсивный градиентный алгоритм

Метод, использующий рекурсивные методы для эффективной аппроксимации информации второго порядка, сохраняя при этом линейную сложность классического стохастического градиентного спуска (SGD).

Глоссарий ИИ

Стохастический метод Ньютона

L-BFGS (алгоритм с ограниченной памятью)

K-FAC (Кронекеровская аппроксимация кривизны)

Естественный градиентный спуск

AdaHessian

Оптимизатор Shampoo

LAMB (построчно-адаптивный оптимизатор моментов)

Оптимизатор Sophia

Метод Ньютона с подвыборкой

Стохастический квазиньютоновский метод

Диагональный метод Гаусса-Ньютона

TNSR (Тензорная нормализованная регуляризация второго порядка)

Онлайн-шаг Ньютона

Стохастический рекурсивный градиентный алгоритм

Результаты не найдены