AI用語集
人工知能の完全辞典
ヘフディングの限界
増分決定木において、有限のサンプル数を用いて、ある属性がノード分割に最適であるかどうかを保証された確率で判定するために使用される統計的限界。
CVFDT (Concept-adapting VFDT)
コンセプトドリフト(概念変動)の検出と適応メカニズムを統合したVFDTの拡張版で、完全な再構築を行わずにツリー構造を動的に変更することを可能にする。
EFDT (Extremely Fast Decision Tree)
過去の分割決定を定期的に再評価し、最適でない分割を修正するためにツリーの再分割を行うVFDTの改良アルゴリズムで、同様の計算量でより高い精度を提供する。
ストリーミング決定木
過去のデータをすべて保存することなく、一定のメモリと時間の制約下で連続的なデータストリームを処理するために特別に設計された決定木アーキテクチャ。
インクリメンタル分割
データセット全体の再評価を必要とせず、新しいデータが到着するにつれて徐々に行われる決定木のノード分割プロセス。
ノード統計量
クラス分布と属性統計を追跡するために、増分ツリーの各ノードで維持される集計カウンタで、ヘフディングの限界に基づく分割決定に不可欠。
グレースピリオド
増分木における分割決定の統計的信頼性を保証するために、分割の対象となる前にノードが観察する必要がある最小サンプル数。
ツリー剪定(インクリメンタル)
コンセプトドリフトによって陳腐化した、またはパフォーマンスが低下したブランチを削除し、ツリー構造を継続的に最適化する、増分決定木における適応的剪定手法。
メモリ効率処理
増分決定木において、ノード統計の賢い管理により、処理されたインスタンス数 n に対してメモリ使用量を O(log n) に制限する戦略。
増分型事前刈り込み
増分木において、完全に展開される前に統計的基準に基づいて潜在的に不要な分岐の生成を防ぐ先制的なメカニズム。
属性評価
増分木においてノード分割のための候補属性を継続的に評価するプロセス。情報利得やジニ係数などの指標を増分的に利用する。
リーフノード適応
新しいインスタンスに基づいて木のリーフノード(葉ノード)における予測を動的に更新するメカニズム。木の構造を変更することなく、分布の変化への適応を可能にする。
タイブレーキング戦略
複数の属性が統計的に同等な性能を持つ場合に増分決定木で使用される同点決定ルール。単純さを重視するヒューリスティックに基づくことが多い。
インスタンスベース学習
各新しいインスタンスがモデルに直ちに影響を与える増分木における学習パラダイム。データに対して複数回のパスを必要とするバッチ学習とは対照的である。