Transformadores de visión
Tokenización de imagen
Proceso de conversión de una imagen 2D en una secuencia de tokens 1D procesables por los Transformers, que implica la segmentación en parches y la proyección lineal. Esta tokenización es el paso crucial que permite adaptar la arquitectura Transformer, diseñada originalmente para el texto, al dominio de la visión.
← Volver