AI用語集
人工知能の完全辞典
ハードマージン
クラスを完全に分離し、誤差を一切許容しないSVMのアプローチ。この方法は外れ値に敏感で、実際のデータセットでは過学習を引き起こす可能性がある。
多項式の次数
多項式カーネルの複雑さを制御するパラメータで、データ変換に使用される多項式の次数を決定する。値が高いほど複雑な関係を捉えられるが、過学習のリスクが増加する。
Coef0
多項式カーネルおよびシグモイドカーネルにおける独立項で、高次および低次の項の影響を制御する。このパラメータは決定関数の形状を調整し、モデルの柔軟性に影響を与える。
許容誤差(トレランス)
SVMの最適化アルゴリズムにおける停止基準で、求める精度を定義する。厳しい許容誤差はより精度の高い解をもたらすが、収束に必要な計算時間が増加する。
多項式カーネル
多項式変換を用いてデータを非線形特徴空間にマッピングするカーネル関数。このカーネルは変数間の高次相互作用を捉えるのに特に適している。
シグモイドカーネル
双曲線正接関数に基づくカーネル関数で、数学的には2層のニューラルネットワークに相当する。このカーネルは非線形関係をモデル化できるが、パラメータの値に敏感である。
線形カーネル
データを変換せず、元の空間で直接処理する最も単純なカーネル関数。線形分離可能なデータに対して効果的で、学習速度が最適である。
イプシロン係数
回帰SVMにおいて、予測関数の周囲に設定される誤差に鈍感な領域の幅を定義するパラメータ。このパラメータは残差に対する許容度を制御し、回帰モデルの頑健性に影響を与える。
キャッシュサイズ
トレーニング中にカーネル計算を保存するために割り当てられるメモリを制御する技術パラメータ。キャッシュサイズが大きいほど、大規模なデータセットの計算が高速化されるが、システムリソースをより多く消費する。
シュリンクング
SVMの最適化問題において、非アクティブな制約を段階的に除去する最適化手法。このヒューリスティックにより、大規模なデータセットでの収束が大幅に高速化される。
最大反復回数
SVMの最適化アルゴリズムで許容される反復回数の上限。このパラメータは無限ループを防ぎ、複雑なデータセットに対する最大計算時間を制御する。