オーディオ向けトランスフォーマー
スペクトログラム用2D位置エンコーディング
スペクトログラムから抽出されたトークンの空間情報(時間と周波数)をエンコードする位置符号化技術。Transformerが音声信号の2D構造を理解できるようにする。
← 戻るスペクトログラムから抽出されたトークンの空間情報(時間と周波数)をエンコードする位置符号化技術。Transformerが音声信号の2D構造を理解できるようにする。
← 戻る