Transformers Multimodaux
Image Captioning Transformer
Architecture encoder-décodeur Transformer générant automatiquement des descriptions textuelles descriptives et cohérentes pour des images d'entrée.
← 뒤로