Transformers de Visão
MAE (Masked Autoencoder)
Abordagem de pré-treinamento auto-supervisionado onde patches aleatórios da imagem são mascarados e o modelo deve reconstruí-los. Permite aprender representações ricas sem a necessidade de rótulos supervisionados.
← Voltar