復(fù)譜映射下融合高效Transformer的語音增強(qiáng)方法
信號(hào)處理
頁數(shù): 11 2024-02-25
摘要: 針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)過去在語音增強(qiáng)中表現(xiàn)優(yōu)異但對(duì)全局特征捕獲不足,以及Transformer近年展現(xiàn)出長序列間依賴優(yōu)勢(shì)但又存在局部細(xì)節(jié)特征丟失、參數(shù)量大等問題,該文為了充分利用CNN與Transformer的優(yōu)勢(shì)并彌補(bǔ)各自不足,提出了一種在復(fù)頻譜映射下的新型卷積模塊與高效Transformer融合的單通道語音增強(qiáng)...