拡散を用いたオーディオ生成
音声拡散モデル (Speech Diffusion Model)
音声データのみで訓練されたオーディオ拡散モデルの専門化版。話者、イントネーション、感情を細かく制御しながら、自然で表現豊かな音声を生成することを目的とする。
← 戻る音声データのみで訓練されたオーディオ拡散モデルの専門化版。話者、イントネーション、感情を細かく制御しながら、自然で表現豊かな音声を生成することを目的とする。
← 戻る