AI用語集
人工知能の完全辞典
CSPDarknet53
YOLOv5のバックボーン最適化で、Cross Stage Partial Network技術を使用して計算負荷を削減しながら特徴抽出の精度を維持します。
Focus Layer
YOLOv5特有の入力層で、空間的再配置と連結を適用して空間解像度を高めながらチャネル数を削減し、情報損失なしに速度を向上させます。
SPP Module
YOLOv5に組み込まれたSpatial Pyramid Poolingで、固定サイズの入力を必要とせずに異なる空間スケールの特徴を抽出し、モデルの堅牢性を向上させます。
Mosaic Data Augmentation
YOLO専用のデータ拡張技術で、4枚の画像を1枚に結合し、モデルが様々な文脈や部分的に可視な物体を検出する学習を強制します。
YOLOv5s/m/l/x
YOLOv5のサイズバリエーションで、速度と精度の異なるトレードオフを提供:small(s)、medium(m)、large(l)、extra-large(x)。
IoU Loss
YOLOv5で使用される損失関数で、予測バウンディングボックスとグラウンドトゥルースの重なりを測定し、IoU評価指標を直接最適化します。
YOLOv5u
Ultralytics版YOLOv5で、アンカーフリーアプローチと収束性の改善を導入し、アンカーボックスを物体寸法の直接予測に置き換えます。
TAL (Task-Aligned Learning)
現代版YOLOバリエーションでの学習アプローチで、物体の分類と位置特定を整合させ、これら2つの基本タスクを同時に改善します。
YOLOX
YOLOの進化版で、アンカーフリーのアーキテクチャ、デカップリングされた学習、データ拡張の改善を導入し、複数のベンチマークでYOLOv5を上回る性能を発揮。
YOLOv7
YOLOの高度なバージョンで、再パラメータ化手法、モデルスケーリング、複合スケーラブルアーキテクチャを導入し、最先端の性能を達成。
AP50:95
YOLOにおける標準的な評価指標で、IoU閾値0.5から0.95までの平均精度を測定し、モデルの総合的な性能を表す。
CSPNet
クロスステージ部分ネットワーク技術で、深層ネットワークにおける勾配の重複情報を削減し、YOLOv5における精度と速度のバランスを最適化。
ELAN
YOLOv7で導入された効率的なレイヤー集約ネットワークで、最短および最長の勾配経路を制御し、収束性と計算効率を向上。
RepConv
畳み込み層の再パラメータ化で、推論時に複数のブランチを単一の畳み込みに変換し、性能を損なわずに速度を向上させる。