AI用語集
人工知能の完全辞典
バウンディングボックス
画像内で検出されたオブジェクトを囲む座標(x, y, 幅, 高さ)で定義された長方形。これは、オブジェクト検出アルゴリズムがターゲットをローカライズし、境界を定めるための標準的な出力です。
インターセクション・オーバー・ユニオン (IoU)
予測されたバウンディングボックスとグラウンドトゥルースのバウンディングボックスとの重なりを測定する評価メトリック。2つのボックスの交差部分の面積を和集合の面積で割ったものとして計算されます。
アンカーボックス
オブジェクト検出器が参照として使用する特定のサイズとアスペクト比を持つ事前定義されたバウンディングボックス。モデルは学習を高速化し安定化させるために、これらのアンカーボックスに対するオフセットを予測します。
平均平均適合率 (mAP)
オブジェクト検出器のパフォーマンスを評価するための基準メトリックで、すべてのオブジェクトクラスにおける平均適合率の平均として計算されます。これは異なる信頼度しきい値での精度と再現率の両方を統合します。
関心領域 (RoI)
分析や処理が集中する画像内の特定の領域。Faster R-CNNのような2段階のアーキテクチャでは、RoIはオブジェクトを含む可能性のある候補領域です。
領域提案ネットワーク (RPN)
2段階の検出アーキテクチャ(例: Faster R-CNN)の重要なコンポーネントで、オブジェクトを含む可能性のある候補領域(RoI)を生成します。効率のために分類ネットワークと畳み込み層を共有します。
1段階検出器
画像に対して一度のパスでオブジェクト検出を実行し、バウンディングボックスとクラスを直接予測するアルゴリズムのファミリー(例: YOLO, SSD)。一般的に2段階の検出器よりも高速ですが、精度が低い場合があります。
2段階検出器
まず候補領域の生成、次にこれらの領域の分類とボックスの微調整という2つのフェーズにプロセスを分ける検出アプローチ。速度を犠牲にして、より高い精度を提供することが多いです。
特徴量ピラミッド
複数のセマンティックレベルと異なる解像度の特徴マップを組み合わせる構造。モデルが同じ画像内の様々なスケールのオブジェクトを検出できるようにし、堅牢性を向上させます。
バウンディングボックス回帰
バウンディングボックスの正確な座標(x、y、幅、高さ)を予測するタスク。モデルは初期のボックス(アンカーなど)を学習し、実際のオブジェクトに最適に合わせるように調整します。
キーポイント検出
オブジェクト検出の拡張機能で、特定の解剖学的または構造的ポイント(例:人体の関節)を特定するもの。姿勢推定によく使用されます。
インスタンスセマンティックセグメンテーション
オブジェクト検出とセマンティックセグメンテーションを組み合わせた高度なタスク。単純なバウンディングボックスの代わりに、各オブジェクトインスタンスを識別し、それぞれに正確なピクセルマスクを割り当てます。