Многоголовая Само-Внимание
Подпространство Представления
Векторное пространство меньшей размерности, в которое каждая голова внимания проецирует данные, позволяя захватывать различные типы отношений и паттернов в данных.
← Назад