AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
情報ゲイン
特定の属性に基づいてデータセットを分割することで得られるエントロピーの減少量を測定する定量的指標。ID3アルゴリズムがツリーの各ノードで最適な分割属性を選択するために使用する。
用語
シャノンエントロピー
データセット内の不確実性や無秩序さを測る数学的な尺度。確率に2進対数を掛けたものの負の合計として計算され、ID3における情報ゲインの計算の基礎となる。
用語
分割属性
与えられたノードでデータセットをより均質なサブセットに分割するために選択される変数。ID3アルゴリズムは、利用可能なすべての属性の中で最大の情報ゲインに基づいてこれを選択する。
用語
リーフノード
ID3決定木の終端ノードで、さらに分割されない。このノードに含まれるサンプルの多数決クラスに基づいて最終的な決定や分類を表す。
用語
情報ゲイン比
属性の固有エントロピーで正規化された情報ゲインの変種。ID3が多数の可能な値を持つ属性に偏るバイアスを修正するために導入された。
用語
訓練データセット
ID3が決定木を構築するために使用するデータのサブセット。ラベル付き例を含み、アルゴリズムが属性とターゲットクラス間の関係を学習できるようにする。
用語
クラス予測
ID3における分類プロセスで、新しいサンプルがルートからリーフまでツリーを辿る。予測されたクラスは、連続する属性テストに従って到達したリーフノードに関連付けられたクラスとなる。
用語
木の深さ
ID3ツリーでルートから任意のリーフまで通過する枝の最大数。モデルの複雑さとデータ内のパターンを捉える能力に直接影響を与える。
用語
純度基準
ノード内のクラスの均一性を測定する指標で、完全に純粋なノードは単一のクラスのサンプルのみを含み、ID3における分割の品質評価の基礎となる。
用語
説明変数
ID3が決定木を構築するために使用する属性の集合で、各属性は目的変数に関する不確実性を低減する能力に基づいて分割ポテンシャルが評価される。
🔍