AI用語集
人工知能の完全辞典
グリッドベースクラスタリング
データ空間を有限の長方形のセルに分割してグリッドを形成し、個々のデータポイントではなく、これらのセルに対してクラスタリングを行う分割手法。
グリッドセル
グリッドの基本となる空間単位であり、点の集合を含むデータ空間の超長方形領域を表し、密度や重心などの統計情報によって特徴付けられる。
セル密度
グリッドセル内の単位体積あたりのデータポイント数を測定したもので、セルがクラスタに属するのに十分な密度を持っているかどうかを判断するための主要な基準として使用される。
STING (Statistical Information Grid)
各グリッドセルに統計情報を格納し、異なる粒度レベルでのクラスタの効率的な問い合わせを可能にする、マルチレゾリューション階層的クラスタリングアルゴリズム。
WaveCluster
離散化されたデータ空間において、変換を適用して高密度領域を識別する、ウェーブレット解析に基づくグリッドベースクラスタリング手法。
CLIQUE (Clustering In QUEst)
高次元データ向けのグリッドベースクラスタリングアルゴリズムで、高密度の部分空間を識別し、接続されたグリッドセルを組み合わせてクラスタを形成する。
均一グリッド
各次元に従ってデータ空間を等しいサイズのセルに分割する離散化の一種で、実装の簡便さを提供するが、空のセルや可変密度のセルが生成される可能性がある。
適応的グリッド
グリッドセルのサイズがデータの局所的な分布に動的に調整される離散化アプローチで、高密度および低密度領域のより良い表現を可能にする。
セル特徴ベクトル
各グリッドセルに含まれるデータポイントを効率的に要約するために、各セルに関連付けられた統計的属性(平均、分散、最小、最大、密度)の集合。
セル連結性
2つのグリッドセルが隣接しているか(面、辺、または頂点を共有しているか)を定義するトポロジー関係であり、それによって単一のクラスタを形成するために統合できるかどうかが決まります。
高密度セルのマージ
データ空間内で任意の形状のクラスタを構築するために、密度のしきい値を超える隣接するグリッドセルを集約する反復プロセス。
マルチレゾリューショングリッド
入れ子になったグリッドの階層を使用して複数の粒度レベルでデータを分析する機能で、異なる空間スケールでクラスタを発見することを可能にします。
密度しきい値
グリッドベースのクラスタリングアルゴリズムにおける重要なパラメータであり、セルが関連性があると見なされ、クラスタに含まれるために必要な最小密度を定義します。
グリッド行列
空間の離散化を表す2次元または多次元のデータ構造であり、各要素はグリッドセルに対応し、その統計情報を格納します。
OptiGrid
空間をセルに分割するための最適超平面を構築し、各部分空間における潜在的なクラスタ間の分離を最大化する、グリッドベースのクラスタリングアルゴリズムです。
グリッド空間インデックス
大規模データベースにおける近傍クエリやクラスタリング操作を高速化するために、グリッド構造を空間インデックスとして利用すること。
境界セル
潜在的なクラスタの周縁部に位置するグリッドセルで、密度が中間的であるため、クラスタへの帰属を判断するにはより詳細な分析が必要となるもの。
グリッドによる次元削減
グリッドによる離散化を通じて、データを元のデータよりも低い次元のセル空間に射影することで、計算の複雑さを低減させる手法。
グリッドベースクラスタリングにおけるノイズ
最小密度のしきい値を満たさないため、グリッドベースクラスタリングアルゴリズムによって自動的にフィルタリングされる、低密度セル内の孤立したデータポイント。