AI用語集
人工知能の完全辞典
DBSCAN (Density-Based Spatial Clustering of Applications with Noise)
教師なしクラスタリングアルゴリズムで、密集した点の群をグループ化し、低密度領域の孤立点を異常値またはノイズとしてマークします。
LOF (Local Outlier Factor)
異常検知手法で、点の局所的な密度の偏差を近傍と比較して測定し、密度が著しく低い点を外れ値として特定します。
DBSCANのEpsilon (ε)
点の周囲の近傍の半径を定義する距離パラメータで、密集領域に属するかどうかを判断し、アルゴリズムの感度に重要です。
DBSCANのMinPts
点がコアポイントとして見なされるために、イプシロン近傍内に必要となる最小点数を示すしきい値パラメータ。
コアポイント (Core Point)
イプシロン半径内に少なくともMinPtsの近傍を持つ点で、DBSCANにおいて密集したクラスタ形成の種として機能します。
K距離 (K-distance)
点とそのk番目に近い近傍との間の距離で、LOFアルゴリズムにおける局所密度の計算の基礎として使用されます。
到達可能距離 (Reachability Distance)
LOFで使用される到達可能距離で、近傍のk距離と2点間の実際の距離の最大値として定義され、密度測定を安定化させます。
局所到達可能密度 (Local Reachability Density - LRD)
点の近傍に対する平均k到達可能距離の逆数で、LOFアルゴリズムにおけるその点の周囲の局所密度を定量化します。
局所外れ値因子(Local Outlier Factor - LOF)
点の到達可能な局所密度とその近傍の平均密度との比で、1より大きいスコアは外れ値である可能性を示します。
OPTICS(Ordering Points To Identify the Clustering Structure)
DBSCANを拡張した密度ベースのアルゴリズムで、密度構造を表現する点の順序を作成し、固定されたイプシロンパラメータなしで異なる解像度のクラスタを抽出できます。
到達可能性グラフ
各点のk距離の到達可能性を視覚的に表現したもので、OPTICSによって生成され、クラスタに対応する密度の谷を識別します。
クラスタツリー凝縮
HDBSCANにおけるプロセスで、異なる密度スケールで持続しないクラスタを統合することで、階層クラスタツリーを単純化します。
密度ベースの異常スコア
点の近傍の密度に基づいてその孤立度を評価する定量的な指標で、検出された異常の重大度を分類するために使用されます。
密度ベース最近傍法
点が外れ値と見なされるのは、その最近傍までの距離が他の点の平均距離より著しく大きい場合の異常検出アプローチです。
密度ベースのサブサンプリング
低密度領域の点を優先的に保持してデータセットのサイズを削減する前処理技術で、異常検出の効率を向上させます。
Isolation Forestと密度の比較
Isolation Forestが特徴空間での孤立のしやすさによって異常を識別するのに対し、密度ベースの手法が空間的な低濃度によって異常を識別するという概念的な違いです。