Détection en deux étapes
Feature Extractor Backbone
Réseau CNN de base (comme ResNet, VGG, ou EfficientNet) qui extrait les caractéristiques visuelles de l'image d'entrée, partagé entre les étapes de proposition et de classification.
← Retour