AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
汚染率
Isolation Forestのハイパーパラメータで、データセット内で予想される異常の割合を定義し、異常スコアに対する決定しきい値を調整するために使用されます。
用語
iTree(分離木)
Isolation Forestでランダムに構築される二分決定木で、各パーティションはランダムに選択された特徴と分離値で実行され、各点が分離されるまで続きます。
用語
分離
異常は「少なくて異なる」データポイントであり、通常のポイントよりも分離しやすく、木内でのパーティション数が少なくなるという原則。
用語
拡張レベル
一部のIsolation Forest実装におけるオプションのハイパーパラメータで、各ノードで同時に分割する次元数を制御し、非常に高次元のデータを処理できるようにします。
用語
スコアリング関数
平均パス長を正規化された異常スコアに変換する数学的関数で、通常はランダム木内のパス長の分布に基づいています。
用語
フォレストサイズ
Isolation Forestで構築されるiTreeの数で、最終的な異常スコアの安定性と精度に影響を与えるハイパーパラメータです。
用語
ノード深さ
iTree内の特定のノードの深さで、データポイントのパス長と分離スコアを計算するために使用されます。
用語
外部異常
データの高密度領域の外に位置する異常のタイプで、迅速な分離によりIsolation Forestで効果的に検出されます。
用語
計算複雑性
Isolation Forestの効率性の測定であり、観測数に対しては線形で、特徴量数に対しては準線形であるため、大規模なデータセットに適しています。
🔍