AI用語集
人工知能の完全辞典
度数分布
量的変数または質的変数の各値またはクラスの発生回数を表形式またはグラフで表したもので、データの構造を視覚化することができる。
ヒストグラム
連続的な量的変数の分布を表す連続した棒グラフで、各棒の面積は対応する区間の観測値の頻度に比例する。
箱ひげ図
最小値、第1四分位数、中央値、第3四分位数、最大値の5つの指標を通じて変数の分布を要約する統計図で、対称性と外れ値の存在を明らかにする。
四分位数
順序付けられたデータセットを4つの等しい部分に分割する値で、Q1は25パーセンタイル、Q2は中央値(50パーセンタイル)、Q3は75パーセンタイルを表す。
標準偏差
分散の平方根として計算される散布度の尺度で、分布の平均値周辺の観測値の平均的な散らばりを定量化する。
分散
平均値からの偏差の二乗の平均値で、データの散布度を測定し、単変量解析における標準偏差の計算の基礎を構成する。
算術平均
すべての観測値の合計をその総数で割って得られる中心傾向の指標で、外れ値の影響を受けやすく、対称的なデータに適している。
中央値
順序付けられた分布を2つの等しい部分に分ける中央の値で、外れ値に対して頑健であり、特に非対称分布に対して有益な情報を提供する。
モード
分布において最も高い頻度で現れる値またはカテゴリー。データ構造によって、単一、複数、または存在しない場合がある。
範囲
変数の最大値と最小値の差として計算される基本的な散布度の尺度で、データの変動性の初期評価を提供する。
変動係数
標準偏差を平均で割った比率で、パーセンテージで表される。単変量解析において、異なるスケールの変数間の相対的な散布度を比較することを可能にする。
歪度
分布の対称性に対する傾きの程度を測定する非対称係数で、左歪み(負)と右歪み(正)の分布を区別する。
棒グラフ
質的変数または離散的な量的変数のグラフ表現で、各棒の高さが各カテゴリーの頻度または度数に比例する。
円グラフ
質的変数の相対頻度に比例する角度の扇形に分割されたグラフで、全体の構成をパーセンテージで視覚化する。
密度プロット
連続変数の確率密度関数を推定する平滑化された曲線で、ヒストグラムに代わる視覚化として、分布のモードと形状を識別する。
四分位範囲
第3四分位数と第1四分位数の差(Q3-Q1)として計算される頑健な散布度の尺度で、中央50%の観測値を含む範囲を表す。
ピアソンの歪度係数
平均値と中央値の差に基づく歪度の指標で、標準偏差で正規化され、特に直感的な歪度の代替測定を提供する。
外れ値
データの一般的なパターンから著しく逸脱した極端な観測値で、四分位範囲法(1.5×IQR)やZスコアなどの方法で識別される。