AI用語集
人工知能の完全辞典
非負行列因子分解 (NMF)
非負行列 V を、同様に非負である 2 つの行列 W と H に分解し、V ≈ WH となるようにする線形代数の手法。データの加法的な解釈を促進する。
基底行列 (W)
NMF において、行列 W は基底ベクトルまたは「成分」を含み、それらを線形結合することで元のデータを再構成する。各列は基本的な特徴を表す。
係数行列 (H)
NMF 分解における行列 H は、各データサンプルに対する各基底(W の)の重みまたは活性化係数を表し、それらの寄与度を示す。
因子分解のランク
NMF の重要なパラメータであるランク (k) は、抽出する成分または潜在因子の数を決定し、分解の粒度と圧縮レベルを制御する。
二乗平均誤差 (フロベニウスノルム)
NMF で最も一般的なコスト関数で、V と WH の要素間の差の二乗和を計算し、全体のユークリッド距離を最小化することを目指す。
乗法的更新ルール
NMF 特有の反復的最適化アルゴリズムで、要素ごとの乗算によって行列 W と H を更新し、非負制約の維持を保証する。
スパース性コスト
行列 W および/または H に多くのゼロを含むように促すために、NMF のコスト関数に追加される正則化項。解釈可能性と特徴選択を向上させる。
凸 NMF
基底行列 W が固定され事前に定義される(多くの場合データ辞書から)NMF の変種。最適化問題を凸にし、H の一意な解を保証する。
並列NMF
NMFの分散計算アプローチであり、行列WとHの要素の更新を複数のコアや計算ノード上で同時に行うことで、収束を高速化する手法。
加法的解釈可能性
PCAなどの他の分解法と比較したNMFの主要な利点であり、成分が全体を構成する部品として足し合わされるため、データの直感的な理解が容易になる点。
NMFの初期化
行列WとHの初期値を選択する重要なプロセス。最適化が凸問題ではないため、収束速度と最終解の品質に影響を及ぼす。
直交NMF
係数行列H(または基底行列W)に直交制約を追加したNMFの拡張版であり、成分間の相関を低減し、より明確に区別させることを強制する。
NMFの安定性
異なる初期化やデータのサブサンプルから得られるNMFの解の一貫性を測る指標。安定性が低い場合、解が潜在的にロバストでない可能性を示唆する。
NMFによるコクラスタリング
行列の行と列を同時に因数分解するNMFの応用であり、共通の潜在構造を共有するサンプルと特徴のクラスタを明らかにする手法。
信号処理におけるNMF
音源の分離や、スペクトル信号を基本成分(音符、楽器)に分解するためにNMFを利用すること。その加法的かつ非負の性質を活用する。
テキスト分析におけるNMF
「トピック」(行列W)と各文書におけるそれらの寄与(行列H)を発見するために、単語-文書行列にNMFを適用する手法。明確なトピック解釈を提供する。
交互最小二乗法 (ALS)
NMFのための最適化戦略。行列(H)を固定して他方(W)を最適化し、その後役割を入れ替えることを収束するまで繰り返すことで問題を解く手法。