Vision Transformers
MAE (Autoencoder Enmascarado)
Enfoque de pre-entrenamiento auto-supervisado donde parches aleatorios de la imagen son enmascarados y el modelo debe reconstruirlos. Permite aprender representaciones ricas sin necesidad de etiquetas supervisadas.
← Volver