AI用語集
人工知能の完全辞典
分離木
Isolation Forestで使用される二分木構造で、各観測値を完全に分離するまでランダムにデータ空間を分割します。
分割の深さ
分離木のルートからリーフまで、特定の観測値を分離するために必要な分割の数。
パス長
観測値が分離木を通過する経路の長さで、ルートからリーフまでに横切るエッジの数として測定されます。
サブサンプリング
Isolation Forestで使用されるランダムサンプリング技術で、各木の構築時にデータのサブセットを選択し、バイアスを減らし効率を向上させます。
汚染率
Isolation Forestのパラメータで、データセット内の異常値の予想される割合を定義し、分類のしきい値を決定するために使用されます。
ワンクラス分類
多数派クラスに属さない観測値を検出することを目的とする教師あり学習の問題で、通常は異常検出に使用されます。
ランダム分割
Isolation Forestでのノード分割戦略で、特徴と分離値がランダムに選択され、従来の決定木の最適化された基準とは異なります。
分離効率
より深い分割を必要とする正常な観測値と比較して、短い経路で異常値を迅速に分離するアルゴリズムの能力。
平均経路長
観察値が森内の全ての木を通過する際のパス長の平均。異なるデータセット間で比較可能な測定値を提供するために正規化されています。
フォレスト構築
トレーニングデータの異なるランダムサブセットで各木をトレーニングすることにより、分離木のコレクションを作成するプロセス。
分離スコア
平均分離深度から計算される0から1の間の正規化された値。値が高いほど異常値である可能性が高いことを示します。
特徴空間分割
各観察値を個別に分離するために、多次元特徴空間を超長方形領域に再帰的に分割すること。
木ベースの異常検出
データの分布をモデル化し、逸脱した観察値を特定するために木構造を使用する異常検出アプローチ。
リーフノード分離
観察値がリーフノード単独で存在し、分離プロセスの終了を示す分離木における終了条件。
教師なし異常検出
アルゴリズムがラベルを必要とせず、データの内在構造のみに基づいて異常を特定する学習パラダイム。
アンサンブル法
異常検出の予測の堅牢性と汎化性を向上させるために、複数のモデル(木)を組み合わせる機械学習技術。
異常しきい値
正常な観測と異常を区別する異常スコアの境界値。通常、指定された汚染率に基づいて決定されます。