AI用語集
人工知能の完全辞典
ファジー単体複体
UMAPがデータポイント間の近傍関係を表現するために使用する数学的構造で、高次元空間における局所的な接続を柔軟にモデル化することを可能にする。
多様体学習
高次元データがより低次元の多様体上に存在するという仮定に基づく教師なし学習のパラダイムで、この基礎となる構造を発見しようとする。
局所接続性
次元削減手法が、元の空間における近接点間の即時の近傍関係を低次元への射影後も維持する能力。
交差エントロピー最適化
UMAPが高次元空間と低次元空間における近傍確率の間の乖離を最小化するために使用する最適化プロセスで、これにより位相構造が保存される。
近傍数(n_neighbors)
UMAPの重要なパラメータで、局所構造と大域構造の保存のバランスを制御し、各データポイントに対して考慮される局所近傍のサイズを決定する。
最小距離(min_dist)
UMAPのパラメータで、射影空間におけるポイントの密集度を調整し、最終的な埋め込みにおける近傍点間の実効最小距離を制御する。
距離メトリック
UMAPが高次元空間におけるポイント間の類似性を測定するために使用する数学的関数で、発見される位相構造に直接影響を与える。
大域構造保存
UMAPが離れたデータクラスター間の大規模な関係を維持する能力で、t-SNE技術に典型的な「混雑問題」の効果を回避する。
確率的勾配降下法
UMAPが使用する最適化アルゴリズムで、損失関数を最小化しながら低次元空間内の点の位置を反復的に調整する。
データのトポロジー解析
UMAPが基盤とする応用数学の分野で、連続変形下で不変な性質を研究し、データ構造を理解する。
UMAP損失関数
近傍点に対する引力と非近傍点に対する斥力を組み合わせたUMAP特有の目的関数で、ファジー交差エントロピーを通じて最適化される。
本質的次元
データの本質的構造を忠実に表現するために必要な最小次元数で、UMAPが推定・保存を目指す重要な概念。
固有値スペクトル
近傍グラフのラプラシアン行列の固有値集合で、UMAPが投影の最適な幾何学的構造を決定するために使用する。
引力-斥力機構
UMAPがシミュレートする物理的メカニズムで、近傍点は互いに引き合い、非近傍点は反発し合い、均衡の取れた空間配置を創出する。
UMAP変換
UMAPによって学習されるマッピング関数で、埋め込みの再計算を必要とせずに、新しい点を既に計算済みの空間に投影することを可能にする。