AI用語集
人工知能の完全辞典
適合率 (Precision)
モデルが行った全ての陽性予測の中で、正しく陽性と予測された割合を評価する指標。偽陽性を最小化することで陽性予測の質を測定する。
再現率 (Recall)
モデルがデータセット内の実際の陽性インスタンスを正しく識別する能力を測定する指標。偽陰性を減らすことで陽性予測の網羅性を定量化する。
F1スコア
適合率と再現率の調和平均であり、これらしばしば相反する二つの指標のバランスを提供する。適合率だけまたは再現率だけでは誤解を招く可能性のある不均衡なクラスに対して特に有用である。
F-betaスコア
F1スコアを一般化したもので、パラメータbetaに応じて適合率と再現率を異なる重みで評価できる。この指標は、適合率(beta<1)または再現率(beta>1)のいずれかを優先するなど、特定の分野のニーズに適応する。
混同行列
予測値と実際の値を比較して分類モデルの性能を要約する分割表。真陽性、偽陽性、真陰性、偽陰性に結果を分解し、詳細な分析を可能にする。
真陽性 (True Positive)
モデルによって正しく陽性として分類されたインスタンスで、ターゲットクラスに対する成功した予測を表す。真陽性は再現率の計算における分子を構成し、適合率の分母に寄与する。
偽陽性 (False Positive)
陰性インスタンスがモデルによって誤って陽性と予測されたもので、タイプIエラーに相当する。偽陽性は適合率に悪影響を与えるが、陽性クラスの再現率には直接影響しない。
真陰性 (True Negative)
モデルによって正しく陰性と識別されたインスタンスで、非関連ケースを拒否する能力を示す。真陰性は多数派クラスにおけるモデルの特異性を評価するために不可欠である。
偽陰性 (False Negative)
モデルによって見逃された正例が誤って負例として分類されることで、タイプIIのエラーを表す。偽陰性は直接的に再現率を低下させ、応用分野によっては重大な結果をもたらす可能性がある。
平均適合率 (Average Precision)
適合率-再現率曲線を要約する指標で、各再現率の閾値における適合率の加重平均を計算する。物体検出システムや情報検索システムの評価に特に適している。
AUC-PRスコア
適合率-再現率曲線下面積であり、分類閾値に依存せずモデルの全体的な性能を測定する。AUC-ROCとは異なり、AUC-PRは少数クラスにおける性能に対してより敏感である。
感度 (Sensitivity)
再現率の同義語であり、モデルによって正しく識別された真の陽性事例の割合を測定する。感度は、陽性事例の検出が優先される医療応用において極めて重要である。
特異度 (Specificity)
モデルが負例を正しく識別する能力であり、真陰性数を実際の負例の総数で割った比率として計算される。特異度は、全てのクラスにおける性能を評価するために再現率を補完する。
バランス精度 (Balanced Accuracy)
感度と特異度の算術平均であり、不均衡なデータセットにおけるバイアスを補正する。この指標は、多数クラスと少数クラスにおける性能を公平に扱う。
適合率-再現率曲線
様々な分類閾値に対して適合率を再現率の関数としてプロットした二次元グラフ。この可視化により、適合率と再現率のトレードオフを分析し、最適な閾値を選択することが可能となる。
ジャカード係数 (Jaccard Score)
2つの集合間の類似度を、それらの共通部分と和集合の比率として測定する指標。分類において、ジャカード係数は予測された陽性インスタンスの集合と実際の陽性インスタンスの集合の一致度を評価する。
トップK精度
モデルの最も確信度の高いK個の予測の中で、正しい予測の割合を評価する指標。特に、上位の提案のみがユーザーに提示されるレコメンデーションシステムで重要である。
トップK再現率
モデルの最も確率の高いK個の予測に限定した従来の再現率の拡張。この指標は、全予測の一部のみを考慮した場合に、システムが関連するインスタンスをカバーする能力を測定する。