AI用語集
人工知能の完全辞典
OOB誤差
ブートストラップサンプリングで選択されなかった観測値で計算される検証誤差で、モデルの汎化誤差の不偏推定値を構成する。OOB誤差は、ランダムフォレストのようなアンサンブル手法における交差検証の代替として機能する。
バギング
異なるブートストラップサンプルで複数のモデルを学習し、多数決投票または平均化によってそれらの予測を組み合わせるアンサンブル手法。バギングは、決定木のような不安定なアルゴリズムに対して特に効果的であり、分散を減少させ予測の安定性を向上させる。
ブートストラップ信頼区間
モデルのパラメータや性能指標の不確実性を定量化するために、ブートストラップ再サンプリングによって推定される信頼区間。パーセンタイル法、BCa法、基本ブートストラップ区間など、複数の方法が存在する。
ジャックナイフ検証
各観測値を順番に除外して推定量のバイアスと分散を推定する系統的再サンプリング手法で、ブートストラップの近似と見なされる。ジャックナイフは計算コストが低いが、ブートストラップよりも柔軟性に欠ける。
順列検証
ターゲットラベルをランダムに並べ替えて性能の帰無分布を作成することで、モデルの統計的有意性を評価するノンパラメトリック検証手法。この技術により、モデルが実際に有意なパターンを学習しているかどうかを検定できる。
ブートストラップバイアス補正
推定量またはモデル評価指標のバイアスを推定し補正するためにブートストラップを使用する手順。この補正により、特に小標本における推定の精度が向上する。
BCaブートストラップ
バイアスと加速(歪度)を補正することで信頼区間を調整する高度なブートストラップ手法。BCaは標準的なパーセンタイル法よりも正確な区間を提供する。
パラメトリックブートストラップ
直接的な再サンプリングではなく、データに適合したパラメトリック分布からサンプルを生成するブートストラップの変法。この方法は、データの基礎となるモデルが既知または仮定されている場合に有用である。
ノンパラメトリック・ブートストラップ
観測データから直接置換抽出を行う古典的なブートストラップ手法で、基礎となる分布について仮定を置かない。この方法はより柔軟で、分布仮定の違反に対して頑健である。
ブートストラップ標本分布
複数のブートストラップ標本上で統計量を計算することによって得られる統計量の経験分布であり、推定量の変動性と漸近的特性を推定することを可能にする。この分布はブートストラップ推論の基礎をなす。
ブートストラップ標準誤差
統計量のブートストラップ分布の標準偏差として計算される標準誤差の推定値であり、分布仮定に依存しない精度の測定を提供する。この推定は特に複雑な統計量に対して有用である。
ブートストラップ仮説検定
ブートストラップを用いて帰無仮説下の分布を生成し、p値をノンパラメトリックに計算する仮説検定の手法。この方法は漸近近似を回避し、複雑な検定統計量でも機能する。
ブートストラップモデル選択
複数の再標本上で異なる候補モデルの安定性と比較性能を評価するためにブートストラップを使用するモデル選択プロセス。この手法は選択プロセス自体の不確実性を定量化する。
ブートストラップ検出力分析
様々な対立仮説下で複数のブートストラップ標本をシミュレートすることにより、検定やモデルの統計的検出力を評価する方法。この手法は制限的な分布仮定なしに必要な標本サイズを推定することを可能にする。
ブートストラップ較正
分類モデルによって予測された確率を調整する技術で、ブートストラップを使用して較正バイアスを推定し補正する。この方法はモデルの確率スコアの信頼性を向上させる。
ブートストラップアンサンブル法
ブートストラップと集約を組み合わせて予測の分散を減少させるアルゴリズムのファミリーで、ランダムフォレスト、エクストラツリー、その他のブートストラップ標本に基づく手法を含む。これらの手法は再標本化によって生み出される多様性を活用する。
ブートストラップ特徴量重要度
複数のブートストラップサンプルを通じてモデルのパフォーマンスへの影響を測定することによる変数重要度の評価。特徴量重要度の信頼区間を提供し、特徴量重要度の安定性を定量化するアプローチ。
ブートストラップモデル安定性
異なるブートストラップサンプル間での予測またはパラメータの一貫性によって評価されるモデルの堅牢性の測定。実際のモデルデプロイメントにおける信頼性のために安定性が重要。
ブートストラップ.632+
ブートストラップ誤差と見かけの誤差を0.632の重みで組み合わせ、過学習に対して調整することで、誤差推定の楽観的バイアスを補正する高度なブートストラップ変法。より正確な誤差推定を提供する手法。