Трансформеры для аудио
2D Позиционное Кодирование для Спектрограмм
Техника позиционного кодирования, которая кодирует пространственную информацию (время и частота) для токенов, извлеченных из спектрограмм, позволяя Transformer понимать 2D-структуру аудиосигнала.
← Назад