AI用語集
人工知能の完全辞典
K-平均法
教師なし学習アルゴリズムで、データセットをK個のクラスターに分割し、各クラスター内の距離の総和を最小化する。各クラスターはセントロイドによって表される。
セントロイド
クラスターの中心を表す幾何学的点で、そのクラスターに属するすべてのデータポイントの平均として計算され、新しい観測値の割り当ての基準として機能する。
クラスター内慣性
同じクラスター内のポイントの分散を定量化する指標で、各ポイントと対応するセントロイド間の二乗距離の合計として計算される。
エルボー法
クラスター数Kの最適な値を決定するためのヒューリスティック手法で、クラスター内慣性をKの関数としてプロットし、慣性の減少が大幅に低下し始める点を特定する。
K-means++
距離に基づく確率分布を使用して初期セントロイドを賢く選択するK-meansの初期化バリアントで、収束とクラスタリングの品質を向上させる。
収束
連続する反復間でセントロイドが大幅に移動しないか、ポイントのクラスターへの割り当てが安定したときに達成される状態で、アルゴリズムが解を見つけたことを示す。
シルエットスコア
クラスタリング内の凝集性とクラスタリング間の分離を測定するクラスタリング評価指標で、-1(悪いクラスタリング)から+1(最適なクラスタリング)の範囲で変動する。
局所的最適解
単純なポイントの再割り当てでは改善できないクラスタリング解だが、必ずしも可能な最良の全体的な構成を表すわけではない。
ミニバッチK-means
K-meansの変種で、データのランダムなサブセット(ミニバッチ)を使用してセントロイドを更新し、大規模なデータセットでより高速な収束を提供します。
クラスタ間慣性
クラスター間の分離度の測定で、異なるクラスターのセントロイドと全体のセントロイドとの間の二乗距離の重み付き合計として計算されます。
ベクトル量子化
K-meansクラスタリングの応用で、類似したベクトルのグループを共通のセントロイドで表現することにより、ベクトルデータを圧縮し、情報の複雑性を削減します。
K-meansの反復
点を最も近いセントロイドに割り当てるフェーズと、割り当てられた点の平均に基づいてセントロイドを更新するフェーズを含むアルゴリズムの完全なサイクルです。
分割
各観測値が正確に一つのクラスターに属するように、データの互いに素な分割を作成することを目的とするK-meansクラスタリングの基本的なアプローチです。
クラスタリングの安定性
異なる初期化で複数回実行した際にK-meansによって得られるクラスタリング結果の一貫性の測定で、見つかった解の堅牢性を評価します。