Multi-Modal Transformers
Incrustación de Modalidad
Vectores de codificación específicos agregados a las incrustaciones de tokens para indicar la modalidad de origen (texto, imagen, audio), permitiendo que el Transformer distinga y procese de manera diferente cada tipo de datos.
← Volver