AI用語集
人工知能の完全辞典
階層的クラスタリング
データをネストされたクラスタの階層構造に整理する教師なし学習手法。通常、デンドログラムと呼ばれる二分木で表されます。
デンドログラム
クラスタの階層構造を木構造で視覚化したもの。各ノードはクラスタの統合を表し、高さはその統合が発生した距離を示します。
単リンク法
2つのクラスタ間の距離を、両クラスタに属する全ての点のペアの中での最小距離として定義する統合基準。鎖状のクラスタを生成する傾向があります。
完全リンク法
異なる2つのクラスタ間の点の最大距離を使用する凝集手法。コンパクトで球形のクラスタを生成する傾向があります。
平均リンク法
2つの異なるクラスタに属するオブジェクトの全てのペア間の平均距離を計算する結合基準。単リンク法と完全リンク法の中間的な特性を提供します。
ウォード法
各統合でクラスタ内分散の増加を最小化する凝集手法。通常、サイズが比較的均等で球形のクラスタを生成します。
結合行列
階層的アルゴリズムの各ステップでクラスタ間の距離を格納する上三角行列データ構造。計算の最適化に不可欠です。
コーフェニック係数
オブジェクトのペア間の元の距離とデンドログラムでのコーフェニック距離間の相関を測定する指標。クラスタリングの品質を評価します。
コフェネティック距離
二つのオブジェクト間の距離で、これらのオブジェクトが同じクラスタにグループ化されるデンドログラムの最初のノードの高さとして定義されます。
凝集型クラスタリング
各観測が個別のクラスタとして開始し、すべてのデータを含む単一のクラスタを形成するまで徐々に融合する階層的クラスタリングのボトムアップアプローチ。
分割型クラスタリング
すべての観測を含む単一のクラスタから開始し、各観測が独自のクラスタを形成するまでクラスタを再帰的に分割するトップダウン戦略。
停止基準
階層的クラスタリングプロセスがいつ停止すべきかを定義する条件のセットで、通常は事前に定義されたクラスタ数または距離の閾値に基づきます。
凝集クラスタリング
指定された距離基準に従って最も近いクラスタを反復的に融合するアプローチを使用する階層的クラスタリングの変種。
単調性
融合距離が非減少であることを保証する階層的連結法の特性で、デンドログラムでの反転を避けるために重要です。
連結空間
特定の連結法によって誘導される計量空間で、クラスタ間の距離がどのように計算されるかを定義し、クラスタリングの最終的な構造に影響を与えます。