Vision Transformers
Cross-Attention Vision Transformer
Architecture utilisant des mécanismes d'attention croisée entre différentes modalités ou représentations, permettant des interactions plus riches entre features.
← Zurück