AI用語集
人工知能の完全辞典
DBSCAN
密度ベースの空間クラスタリングアルゴリズム。十分に近い点をグループ化し、密度が低い領域の孤立点を外れ値としてマークします。
Epsilon (ε)
点がクラスタに属するかどうかを判断するために、点の周りの近傍半径を定義するパラメータ。クラスタリングの粒度に直接影響します。
MinPts
点がコア点と見なされるために、ε近傍内に必要な最小点数を定義するしきい値パラメータ。
Point Core
コア点。クラスタの中心点で、ε近傍内に少なくともMinPts個の点を持ち、密なクラスタを形成するためのアンカーポイントとして機能します。
Point Border
ボーダー点。クラスタの周辺に位置し、コア点となるほどの近隣点はありませんが、コア点から到達可能な点です。
Point Noise
ノイズ点。コア点でもコア点から到達可能でもないため、どのクラスタにも属さず、異常値と見なされることが多い点です。
Voisinage ε
ε近傍。与えられた点からε以下の距離にあるすべての点の集合。DBSCANにおける密度計算の基礎を形成します。
Densité-directement atteignable
密度直接到達可能。コア点pのε近傍内にある場合、点qがpから直接到達可能となる関係性。
密度到達可能
コアポイントから密度直接到達可能な点の連鎖を通して到達可能な点との推移的関係。
密度連結
二つの点が共通のコアポイントから両方とも密度到達可能である場合に接続される対称的関係。
OPTICS
DBSCANを拡張したアルゴリズムで、密度に基づくクラスタリング順序を生成し、可変密度のクラスタを抽出することを可能にする。
HDBSCAN
DBSCANの階層的変種で、可変密度のクラスタ階層を構築し、安定したクラスタを自動的に選択する。
R-treeインデックス
半径ε内の近傍探索を最適化する空間インデックスデータ構造で、大規模データセットでのDBSCANを大幅に高速化する。
次元の呪い
高次元空間で距離測定が意味を失う現象で、密度ベースのアルゴリズムの性能に影響を与える。
シルエットスコア
クラスタ内凝集性とクラスタ間分離性を測定する評価メトリックで、εとMinPtsパラメータの最適化に使用される。
任意形状のクラスタ
K-meansなどのアルゴリズムとは異なり、非凸形状や複雑な形状のクラスタを検出できるDBSCANの主な利点。
異常検出
DBSCANの自然な応用であり、ノイズとして識別されたポイントがデータ内の異常値や外れ値に対応する。
空間分割
データ空間を密度に基づく領域に分割するプロセスで、DBSCANおよび類似のアルゴリズムの動作の基礎となる。
近傍グラフ
ノードがポイントであり、エッジがε近傍内のポイントを接続するグラフ表現で、密度構造を視覚化するために使用される。
到達可能性距離
OPTICSとHDBSCANで使用される修正距離で、局所的な密度を考慮してポイントを到達可能性に応じて順序付けする。
コア距離
ポイントがコアポイントになるために必要な最小距離で、MinPts番目に近い近傍までの距離として計算される。