AI 詞彙表
人工智能完整詞典
Convolution 1x1
Opération de convolution avec un noyau de taille 1x1 utilisée pour réduire ou augmenter le nombre de canaux d'activation sans altérer les dimensions spatiales de la carte de caractéristiques.
Expansion Ratio
Facteur multiplicatif qui détermine de combien le nombre de canaux est augmenté dans la phase d'expansion d'une architecture bottleneck avant d'être réduit dans la phase de projection.
Inverted Residual Block
Variante du bloc bottleneck où l'expansion des canaux précède la convolution, et la réduction a lieu après, optimisée pour les réseaux mobiles comme MobileNetV2.
Channel Shuffle
Opération qui réorganise les canaux dans les groupes de convolution pour permettre le flux d'informations entre eux, essentielle dans les architectures comme ShuffleNet.
Ghost Module
Technique de génération de cartes de caractéristiques fantômes à partir de cartes primaires par des transformations linéaires à faible coût, réduisant la redondance computationnelle.
Linear Bottleneck
Contrainte dans les blocs résiduels inversés où la couche finale de projection utilise une activation linéaire pour préserver l'information et améliorer la gradient propagation.
Factorized Convolution
Décomposition d'une convolution 2D en deux convolutions 1D successives (spatiales et canaux) pour réduire les paramètres tout en maintenant une capacité de modélisation équivalente.
Cardinality
Dimension de complexité d'un bloc résiduel représentant le nombre de chemins parallèles, alternative à la profondeur et la largeur pour améliorer la performance du modèle.
Temporal Bottleneck
Adaptation de l'architecture bottleneck pour les données séquentielles où la réduction de dimensionnalité s'applique à la dimension temporelle plutôt que spatiale.
Asymmetric Convolution
Utilisation de noyaux de convolution non-carrés (ex: 3x1 et 1x3) pour remplacer une convolution 3x3, réduisant les paramètres tout en capturant efficacement les motifs spatiaux.
Dilated Bottleneck
Intégration de convolutions dilatées dans la structure bottleneck pour augmenter le champ réceptif sans augmenter la complexité computationnelle, utile pour la segmentation sémantique.