AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
極値理論
分布の極値の漸近的挙動を研究する統計学の分野で、稀に発生する大規模な事象のモデル化と予測を可能にする。
用語
ロバスト統計
仮定の違反や極値に対して頑健な統計手法の集合で、汚染されたデータが存在する場合でも信頼性の高い推定を提供する。
用語
ウィンザライゼーション
極値を指定された分位数で置き換える統計的変換技術で、外れ値の分析への影響を制限する。
用語
クックの距離
回帰分析における影響力の測定指標で、推定されたモデルパラメータに不均衡な影響を与える観測値を特定し、レバレッジと残差を組み合わせたもの。
用語
レバレッジ点
予測変数が極端な値を持つ観測点で、期待されるモデルに従っている場合でも回帰係数に過度な影響を及ぼす可能性がある。
用語
破壊点
統計的推定量が任意に誤った結果を生じる前に許容できる汚染の最小割合で、手法の頑健性を測定する。
用語
DBSCANクラスタリング
密度に基づくクラスタリングアルゴリズムで、任意の形状のクラスタを自動的に識別し、ノイズ点を極値として検出できる。
用語
グラブス検定
正規分布するデータ中の単一の外れ値を検出するためのパラメトリックな統計検定で、標準化された標準偏差に基づく。
用語
極端パーセンタイル法
分布の上位または下位パーセンタイルに基づいて極端な値を特定するアプローチ。一般的に極端な1%または5%を閾値として使用する。
用語
中央絶対偏差
中央絶対偏差から計算される頑健な散布度の測定値。外れ値に対して強固であり、標準偏差の代替となる。
用語
影響力のある観測値
存在または不在によって統計分析の結果が大きく変化するデータポイント。クック距離などの測定値によって検出される。
用語
テューキーのフェンス
四分位範囲に基づく境界を使用した外れ値検出方法。通常、1.5*IQRで中程度、3*IQRで極端な外れ値を検出する。
用語
ショーヴネの基準
正規分布を仮定した場合の観測値の発生確率に基づいて外れ値を特定する古典的統計検定。
🔍