Трансформеры для аудио
Wav2Vec 2.0
Фреймворк самообучения для распознавания речи, предварительно обученный на сырых аудио данных, использующий векторную квантизацию для изучения дискретных представлений разговорного языка.
← Назад