AI用語集
人工知能の完全辞典
SSD (Single Shot MultiBox Detector)
リージョン提案を排除し、異なる解像度の特徴マップ上で複数のスケールのデフォルトアンカーボックスを使用して、迅速かつ正確な検出を行うオブジェクト検出アーキテクチャ。
アンカーボックス (Anchor Boxes)
オブジェクトのバウンディングボックスを予測するための参照として使用される、特定の高さと幅を持つ事前定義されたボックスのセットで、ワンステップ検出器の収束を加速し精度を向上させる。
RetinaNet
Focal Loss損失関数を導入して背景クラスと前景クラスの極端な不均衡問題を解決するワンステップ検出アーキテクチャで、ツーステップモデルに匹敵する性能を達成する。
検出効率 (Detection Efficiency)
検出精度と推論速度のトレードオフを評価する性能指標で、特定の平均精度(mAP)に対して1秒あたりのフレーム数(FPS)で表されることが多い。
特徴マップ (Feature Map)
畳み込みニューラルネットワーク層によって抽出された特徴の空間表現で、各点は入力画像の領域に対応し、検出のためのセマンティック情報を符号化する。
受容野 (Receptive Field)
特徴マップ内の特定のニューロンに影響を与える入力画像の領域で、そのサイズはネットワークの深さとともに増加し、異なるスケールのオブジェクトを検出するために重要。
密な検出 (Dense Detection)
スパースな手法とは対照的に、特徴マップの各空間位置でオブジェクトを予測する検出戦略で、より完全な検出を可能にするが、冗長な予測を効率的に管理する必要がある。
マルチスケール (Multi-Scale)
異なるサイズのオブジェクトの検出を改善するために、異なる空間解像度の特徴を同時に処理する検出アプローチで、特徴ピラミッドや並列ブランチを通じて実装されることが多い。
信頼度スコア (Shinraido Sukoa)
モデルが予測した確率値で、特定のクラスのオブジェクトを含むバウンディングボックスの確実性の度合いを示し、検出のフィルタリングと評価に使用されます。
関心領域 (Kanshin Ryouiki)
検出または分類のためにモデルが集中する画像内の特定の領域で、ワンステージ検出器では特徴グリッド上の予測によって暗黙的に定義されます。
バックボーン (Bakkubōn)
検出アーキテクチャにおける主要な特徴抽出器として使用される事前学習済みの畳み込みニューラルネットワーク(ResNet、VGG、Darknetなど)で、基本的な視覚表現を提供します。
検出ヘッド (Kenshutto Heddo)
ワンステージ検出器の最終モジュールで、バックボーンによって抽出された特徴を受け取り、グリッドの各位置に対してバウンディングボックス、クラス、および信頼度スコアを予測します。
ボックスオフセット (Bokkusu Ofusetto)
事前定義されたアカーボックスからのオフセット予測で、オブジェクトの位置を微調整するために使用され、予測とアンカー間の座標(x、y)と寸法(幅、高さ)の違いを表します。