AI用語集
人工知能の完全辞典
情報漏洩(ブレンディング)
ブレンディング特有のリスクで、ホールドアウトセットが十分に代表性を持っていない場合や小さすぎる場合に、メタモデルがベースモデルの予測を過学習する可能性があります。
ブレンディングの重み
メタモデル(多くの場合、単純な線形回帰)によって学習される係数またはパラメータで、最終的な組み合わせで各ベースモデルの予測を重み付けするために使用されます。
2段階トレーニング
ブレンディングの逐次プロセスで、まずベースモデルがトレーニングされ、次にそれらの予測に対してメタモデルがトレーニングされます。
スタック交差検証
ブレンディングの代替手法で、トレーニングセットに対する交差検証によってメタモデルの予測が生成されます。過学習のリスクを減らしますが、複雑さが増します。
モデルの多様性
ブレンディングにおける重要な原則で、異なるアルゴリズムのベースモデル(例:決定木、SVM、ニューラルネットワーク)を使用して多様なパターンを捉え、全体的なパフォーマンスを向上させます。
Out-of-Fold予測
交差検証の各フォールドの検証データに対してモデルが生成した予測で、スタッキングでは使用されますが、ブレンディングではホールドアウトセットを優先して使用されません。
メタモデルの過学習
メタモデルがベースモデルの予測の組み合わせを一般化する代わりに、ホールドアウトセット上の予測を記憶してしまう現象で、ホールドアウトセットが小さすぎる場合やメタモデルが複雑すぎる場合に発生します。
線形ブレンディング
ブレンディングの単純化された形式で、メタモデルが線形回帰であり、ベースモデルの予測の最適な線形結合を見つけるに留まります。
ブレンディングのための層化分割
ブレンディングのためにデータセットをトレーニングセットとホールドアウトセットに分割する手法で、ターゲットクラスの分布を維持し、メタモデルの予測におけるバイアスを避けるために使用されます。
予測の融合
複数の推定器の出力を組み合わせるアクションで、より堅牢な最終予測を生成するためのブレンディングや他のアンサンブル手法の核をなします。
重み付けブレンディング
ベースモデルの予測に割り当てられる重みがメタモデルによって学習されるのではなく、手動またはヒューリスティックによって定義されるブレンディングの変種です。
ブレンディングにおける一般化
最終的なブレンディングモデルが見えない新しいデータで正しく性能を発揮する能力で、ベースモデルの堅牢性とメタモデルがそれらの組み合わせを一般化する能力に依存します。