Transformadores Multi-Modais
BEiT-3
Modelo Bidirectional Encoder representation from Image Transformer v3 usando um Transformer multivias com embeddings específicos de modalidade para processar imagem, texto e imagem-texto de maneira unificada.
← Voltar