Arquitectura BERT
Capa de Pooling
Capa final que agrega las representaciones de tokens en un vector único para tareas de clasificación. BERT típicamente usa la representación del token [CLS] o realiza un pooling promedio sobre todos los tokens.
← Volver