AI用語集
人工知能の完全辞典
ローテーションフォレスト
主成分分析(PCA)によって変換された特徴量セット上で決定木を構築し、ベース分類器間の多様性を最大化するアンサンブル学習法。
サブセットでの主成分分析
特徴量空間のランダムな分割に主成分分析を適用し、フォレストの各分類器に対して異なる射影軸を作成する手法。
回転行列
主成分分析から得られる直交行列で、データを新しい特徴量空間に射影するために使用され、木の予測の無相関化と多様性を確保する。
分類器の多様性
ベースモデル間の予測の差異を最大化し、全体の分散を削減し汎化性能を向上させることを目指すアンサンブル学習の基本原則。
変換付きバギング
ブートストラップサンプルが各ベースモデルの学習前に特徴量空間の変換を受ける、ブートストラップ集約の拡張手法。
グループによる特徴量選択
変数を分割不能なサブセットに分割し、各サブセットに独立した変換を適用して分類器の不均一性を高める手法。
K分割特徴量分割
ローテーションフォレストのための特徴量をKグループに分割する戦略で、各グループは最終的な特徴量セットを形成するために再結合される前に別々に変換される。
拡張された特徴量空間
各特徴量サブセットから得られる主成分を連結して作成される新しい表現空間で、元の情報をすべて保持しながら多様性を増加させる。
射影データ上の決定木
PCAによって変換された空間に事前に射影されたデータで訓練されたRotation Forestにおけるベース分類器。ここで決定ノードは元の特徴の線形組み合わせで動作します。
回転係数
直交変換行列のパラメータ。各元の特徴が特定の森の木に対して新しい主成分にどのように寄与するかを定義します。
成分ごとの説明分散
PCAから得られる指標で、各主成分が捉えるデータの全分散の割合を示し、Rotation Forestにおける変換の品質に影響を与えます。
特徴の直交化
作成された新しい特徴間の線形独立性を保証する数学的プロセス。冗長性を避け、アンサンブル内の多様性を最大化するために不可欠です。
異種アンサンブル
異なる特徴空間で動作するベース分類器のコレクション。Rotation Forestでは、各木が入力データの一意の回転を観察するような場合です。
共分散の削減
異なる分類器の間のエラーの共分散を、データの無相関表現で動作するように強制することで最小化することを目的とするRotation Forestの目標。
局所線形射影
森の各木に固有の変換で、特徴のサブセットにのみ適用され、特定の分類器に対してデータの一意の視点を作成します。
PCAの安定性
訓練データの変動に対する主成分分解の堅牢性。Rotation Forestのパフォーマンスと一貫性にとって重要な要因です。
グループハイパーパラメータ
ローテーションフォレストにおけるグループあたりの特徴量の数を制御するパラメータで、分類器の多様性と各変換で保持される情報とのバランスに直接影響を与えます。