AI用語集
人工知能の完全辞典
Online Matrix Factorization (OMF)
行列を低ランクの因子に順次的に分解する手法の集合であり、新しいデータが到着するたびに因子を更新するため、完全な再学習を必要としない。
Stochastic Gradient Descent (SGD) pour OMF
一度に1つのサンプル(またはミニバッチ)で計算された損失関数の勾配を用いて行列因子を更新する反復的最適化アルゴリズムであり、データストリームに適している。
Incremental SVD
新しいデータの列や行を組み込むために、最初から再計算することなく既存の特異ベクトルと特異値を更新する、特異値分解(SVD)の変種。
Projection Approximate Subspace Tracking (PAST)
最小二乗コスト関数を最小化しながら、共分散行列の支配的な固有ベクトルによって張られる部分空間をリアルタイムで追跡する再帰的アルゴリズム。
Oubli Exponentiel (Exponential Forgetting)
更新プロセスにおいて、古い観測値よりも最近の観測値に重みを付けるメカニズムであり、データ分布の変化(コンセプトドリフト)に対してモデルが適応することを可能にする。
Streaming Recommender Systems
オンライン行列分解を利用して、新しいインタラクションからユーザーとアイテムのプロファイルを継続的に更新し、リアルタイムで適切な提案を行うレコメンデーションシステム。
Méthode des Moindres Carrés Récursifs (RLS)
重み付き最小二乗コスト関数を再帰的に最小化する適応アルゴリズムであり、SGDよりも計算コストは高くなるが、高速な収束を提供する。
Mise à Jour par Bloc (Block Update)
行列因子を新しいデータごとに更新するのではなく、観測値のブロックが蓄積された後に更新する戦略であり、応答性と計算効率のバランスをとるものである。
オンライン非負値行列因子分解
因子に非負制約を課すオンライン行列分解の変種であり、加法的で解釈可能な分解を生成する。テキストや画像の解析によく使用される。
オンライン損失関数
因子の更新を導くために新しい観測値に対して計算される誤差の尺度。通常、二乗平均誤差やダイバージェンス(例:カウントデータの場合はKLダイバージェンス)が使用される。
外れ値に対するロバスト性
データストリーム内のノイズや誤った観測値が存在しても、性能が著しく低下しないオンライン行列分解アルゴリズムの能力。多くの場合、ロバスト損失関数を通じて実現される。
サンプルあたりの計算量
単一の新しい観測値を用いて行列因子を更新するために必要な計算コスト(時間とメモリ)の尺度。オンラインアルゴリズムのスケーラビリティを評価するための重要な基準である。
コールドスタート
新しいユーザーやアイテムの潜在因子を確実に推定するために十分なデータを蓄積する前に、モデルが予測を提供しなければならないオンライン行列分解における課題。
Ojaアルゴリズム
共分散行列の主固有ベクトルをオンラインで計算するための単純な確率的アルゴリズム。リアルタイムでの部分空間の追跡において基礎となる。