AI用語集
人工知能の完全辞典
R-CNN (Regions with CNN features)
まずSelective Searchで候補領域を抽出し、次に各領域を事前学習済みの畳み込みニューラルネットワークで分類する、2段階の検出アルゴリズム。
Selective Search
色、テクスチャ、サイズに基づいて類似したピクセルをグループ化し、候補領域の提案を生成する階層的セグメンテーション手法。
RoI Pooling (Region of Interest Pooling)
サイズが可変な候補領域を、空間的特徴を維持したまま分類器のために固定サイズの出力に変換するニューラルネットワークの層。
RPN (Region Proposal Network)
特徴マップの各空間位置において、候補となるバウンディングボックスとオブジェクトスコアを同時に予測する、完全に畳み込み的なサブネットワーク。
Anchor Boxes
RPNがバウンディングボックスの予測を正規化し、収束を加速させるために使用する、異なるサイズとアスペクト比を持つ事前定義された基準ボックス。
Feature Pyramid Network (FPN)
横方向とトップダウンの経路でマルチスケールの特徴ピラミッドを構築し、Faster R-CNNにおける様々なサイズのオブジェクト検出を向上させるアーキテクチャ。
Cascade R-CNN
検出器が段階的に増加するIntersection over Union (IoU)しきい値で逐次的に学習され、バウンディングボックスの予測を徐々に洗練させる多段階アーキテクチャ。
Bounding Box Regression
変換を学習することで、予測されたバウンディングボックスの座標を微調整し、グラウンドトゥルースのボックスとの誤差を最小化する回帰タスク。
RoIAlign
強制量子化を避けるために正確なバイリニアサンプリングを使用するRoI Poolingの改良版で、インスタンスセグメンテーションの空間的アライメントをより良く保持します。
Feature Extractor Backbone
入力画像から視覚的特徴を抽出する基本的なCNNネットワーク(ResNet、VGG、EfficientNetなど)、提案と分類のステップ間で共有されます。
Two-Stage Detector
候補領域の生成と正確な分類・位置特定を明確に分離する検出パラダイムで、通常、速度を犠牲にして精度を向上させます。
Region Proposal Quality
アルゴリズムが関連する候補領域を生成する有効性の測定値で、真実のボックスとの異なるIoU閾値での再現率で評価されます。
Multi-Scale Training
オブジェクトサイズの変化に対する検出器の堅牢性を向上させるために、異なるスケールにリサイズされた画像を使用するトレーニング戦略。
Contextual Reasoning Module
検出を向上させるためにオブジェクト間の関係とグローバルな文脈をモデル化するコンポーネントで、しばしば注意メカニズムやグラフを統合します。