Глоссарий ИИ
Полный словарь искусственного интеллекта
Онлайн-матричная факторизация (OMF)
Набор методов, последовательно разлагающих матрицу на множители низкого ранга, обновляя множители по мере поступления новых данных без необходимости полного переобучения.
Стохастический градиентный спуск (SGD) для OMF
Итеративный алгоритм оптимизации, который обновляет матричные множители, используя градиент функции потерь, вычисленный на одном образце (или мини-пакете) за раз, что идеально подходит для потоков данных.
Инкрементальное сингулярное разложение (SVD)
Вариант сингулярного разложения, который обновляет существующие сингулярные векторы и сингулярные значения для включения новых столбцов или строк данных без пересчета с нуля.
Проекционная аппроксимация отслеживания подпространства (PAST)
Рекурсивный алгоритм, который отслеживает в реальном времени подпространство, порождаемое главными собственными векторами ковариационной матрицы, минимизируя функцию стоимости наименьших квадратов.
Экспоненциальное забывание
Механизм, придающий больший вес недавним наблюдениям по сравнению со старыми в процессе обновления, позволяющий модели адаптироваться к изменениям распределения данных (дрейфу концепции).
Потоковые рекомендательные системы
Рекомендательные системы, использующие онлайн-матричную факторизацию для непрерывного обновления профилей пользователей и элементов на основе новых взаимодействий, обеспечивая актуальные предложения в реальном времени.
Метод рекурсивных наименьших квадратов (RLS)
Алгоритм адаптации, который рекурсивно минимизирует взвешенную функцию стоимости наименьших квадратов, обеспечивая быструю сходимость ценой более высокой вычислительной сложности по сравнению с SGD.
Блочное обновление
Стратегия, при которой матричные множители обновляются не для каждой новой порции данных, а после накопления блока наблюдений, обеспечивая компромисс между реактивностью и вычислительной эффективностью.
Онлайн-разложение неотрицательных матриц (NMF)
Вариант онлайн-факторизации матриц, который накладывает ограничения неотрицательности на факторы, создавая аддитивные и интерпретируемые разложения, часто используемые для анализа текстов или изображений.
Онлайн-функция потерь
Мера ошибки, вычисляемая на новых наблюдениях для руководства обновлением факторов, обычно среднеквадратичная ошибка или расхождение (например, KL-расхождение для счетных данных).
Устойчивость к выбросам
Способность алгоритма онлайн-факторизации не существенно ухудшаться при наличии шума или ошибочных наблюдений в потоке данных, часто достигаемая с помощью робастных функций потерь.
Сложность на образец (Per-Sample Complexity)
Мера вычислительных затрат (времени и памяти), необходимых для обновления матричных факторов при одном новом наблюдении, ключевой критерий для оценки масштабируемости онлайн-алгоритмов.
Холодный старт (Cold-Start)
Проблема онлайн-факторизации, при которой модель должна выдавать прогнозы до того, как будет накоплено достаточно данных для надежной оценки латентных факторов новых пользователей или элементов.
Алгоритм Оя
Простой стохастический алгоритм для онлайн-вычисления главного собственного вектора ковариационной матрицы, фундаментальный для отслеживания подпространств в реальном времени.