大幅降低非穩態噪聲的九個步驟
發布時間:2011-06-10
中心議題:
移yi動dong運yun營ying商shang非fei常chang明ming白bai語yu音yin質zhi量liang對dui於yu留liu住zhu用yong戶hu來lai說shuo很hen重zhong要yao。影ying響xiang語yu音yin質zhi量liang的de一yi個ge主zhu要yao因yin素su是shi環huan境jing噪zao聲sheng,因yin此ci任ren何he抑yi製zhi噪zao聲sheng的de方fang法fa對dui於yu手shou機ji製zhi造zao商shang來lai說shuo都dou是shi一yi個ge實shi現xian差cha異yi化hua的de機ji會hui。不bu過guo,直zhi到dao最zui近jin噪zao聲sheng抑yi製zhi技ji術shu還hai隻zhi專zhuan注zhu於yu降jiang低di緩huan慢man變bian化hua的de穩wen態tai噪zao聲sheng源yuan。然ran而er,很hen多duo非fei穩wen態tai噪zao聲sheng源yuan為wei快kuai速su變bian化hua的de,因yin此ci不bu能neng被bei抑yi製zhi。因yin而er,用yong戶hu不bu能neng在zai繁fan忙mang的de大da街jie上shang、擁擠的酒店或者甚至是在家裏可靠地使用他們的手機。
抑(yi)製(zhi)非(fei)穩(wen)態(tai)噪(zao)聲(sheng)對(dui)用(yong)戶(hu)和(he)運(yun)營(ying)商(shang)都(dou)有(you)很(hen)大(da)的(de)好(hao)處(chu)。用(yong)戶(hu)可(ke)以(yi)在(zai)任(ren)何(he)時(shi)候(hou)和(he)任(ren)何(he)地(di)點(dian)自(zi)由(you)清(qing)楚(chu)地(di)通(tong)話(hua),可(ke)以(yi)在(zai)嘈(cao)雜(za)的(de)環(huan)境(jing)中(zhong)低(di)聲(sheng)說(shuo)話(hua)以(yi)保(bao)護(hu)其(qi)隱(yin)私(si),不(bu)會(hui)被(bei)要(yao)求(qiu)離(li)開(kai)重(zhong)要(yao)的(de)電(dian)話(hua)會(hui)議(yi)。運(yun)營(ying)商(shang)會(hui)看(kan)到(dao)丟(diu)失(shi)用(yong)戶(hu)的(de)數(shu)量(liang)降(jiang)低(di),增(zeng)加(jia)通(tong)話(hua)時(shi)間(jian),而(er)且(qie)更(geng)有(you)效(xiao)地(di)使(shi)用(yong)網(wang)絡(luo)帶(dai)寬(kuan),並(bing)大(da)大(da)地(di)節(jie)省(sheng)投(tou)資(zi)和(he)運(yun)營(ying)成(cheng)本(ben)。

圖1.在采用瞬時非穩態噪聲抑製技術前後的時域波形。
1.理解穩態和非穩態噪聲之間的差異
由於其相對穩定的特性—例(li)如(ru)嘈(cao)雜(za)的(de)鼓(gu)風(feng)機(ji)環(huan)境(jing)中(zhong),穩(wen)態(tai)噪(zao)聲(sheng)可(ke)以(yi)很(hen)容(rong)易(yi)地(di)被(bei)識(shi)別(bie),能(neng)用(yong)傳(chuan)統(tong)的(de)新(xin)好(hao)處(chu)理(li)方(fang)法(fa)輕(qing)易(yi)地(di)去(qu)除(chu)。相(xiang)反(fan),非(fei)穩(wen)態(tai)噪(zao)聲(sheng)具(ju)有(you)快(kuai)速(su)或(huo)隨(sui)即(ji)的(de)變(bian)化(hua),例(li)如(ru)一(yi)個(ge)人(ren)的(de)說(shuo)話(hua)聲(sheng)、背景音樂或按鍵音。當非穩態噪聲被作為噪聲識別的時候,這些噪聲實際上已經通過,因此需要更成熟的噪聲抑製方法。
2.使用兩個麥克風來改善對聽覺現場的理解
下一代噪聲抑製技術,例如聽覺場分析(ASA)、波束成形(BF)和盲源隔離(BSS)使用幾個麥克風來更準確地識別、定位以及噪聲源分組,準確性比單個麥克風更高。當今的手機製造商已經意識到這種趨勢,在手機的架構中引入了第二個麥克風。
3.利用分組原理來分隔聲音點
分組方法簡化了噪聲抑製,同時還能確定非穩態噪聲源。例如聽覺場分析(ASA)使用人的聽覺通道作為一個模型,按照人實際對某個聲音的聽覺來處理噪聲。通過多聲學能量進行分組來重新產生原來的聲音,ASA實現了來自多個源的準確分組,同時避免任何聽覺上應該分開的聲音被混合在一起。分組原理可以被大致描述為連續的(在一段時間內發生的)和同時的(在一段頻率內)。
4.使用多個線索來分組,否則難以正確地對聲音進行分組
每一個分組線索都有局限性。使用多個線索能對難以分析的聲音進行正確的分組。某些重要的線索包括:
•聲音的特性:一個音源產生的諧波可以形成清楚的頻率圖,這個頻率圖可以用來對兩個聲音進行區分。聲音特性是區分男人和女人的一個主要線索。
•空間信息:由距離和方向判斷出來的距離可以用來對聲音分組,因而可以對感興趣的聲音進行分辨。
•發出時間:如果兩個聲音能量和他們對應的諧波在時間上一致,他們很可能來自同一個音源。
5.減少收斂時間以消除更多的瞬間噪聲
傳chuan統tong的de噪zao聲sheng抑yi製zhi方fang法fa必bi須xu在zai他ta們men消xiao除chu噪zao聲sheng之zhi前qian收shou斂lian,因yin而er他ta們men在zai抑yi製zhi非fei穩wen態tai噪zao聲sheng源yuan上shang效xiao率lv較jiao低di。通tong過guo利li用yong快kuai速su響xiang應ying的de線xian索suo來lai對dui聲sheng音yin進jin行xing描miao述shu,像xiang打da響xiang指zhi這zhe樣yang的de瞬shun間jian時shi間jian都dou可ke以yi被bei識shi別bie並bing消xiao除chu。
6.采用對數與線性頻率比例(FCTvs.FFT)
熟悉的快速傅立葉變換(FFT)duipinlvfenlianganxianxingbilijinxingfenjie,zheyangxianzhilezaidipinchudepinpufenbianlv,erqieshiyonghendingdezhendaxiaoheduliyupinlvdedaikuan。xiangfande,kuaisuerwobianhuan(FCT)基於人耳蝸的原理,按對數頻率比例變化。這樣一來,它不會限製頻譜分辨率。通過不斷的處理,而不是按幀進行處理,FCT還降低了處理延遲,因此它適合於識別非穩態的噪聲源。此外,FCT工作的帶寬是與頻率相關的,在人耳聽覺範圍內能更準確地匹配時域-頻域折衷。
7.使用全向麥克風來降低成本
像波束成形這類方法需要一種專門的心型曲線式(cardioid,單向)麥克風。這種麥克風的成本比全向麥克風成本更高,具有更低的噪聲容限,必須進行單獨的校準和匹配,誤差要低於1dB,帶來對間隔的限製,由於對風聲和呼吸聲很敏感,因此會增加+12dB的de噪zao聲sheng。波bo束shu成cheng形xing技ji術shu也ye有you其qi局ju限xian性xing,對dui所suo關guan注zhu的de波bo束shu的de任ren何he錯cuo誤wu選xuan擇ze都dou會hui被bei錯cuo誤wu地di傳chuan遞di。對dui一yi個ge係xi統tong所suo需xu要yao的de麥mai克ke風feng的de數shu量liang的de管guan理li也ye很hen重zhong要yao。例li如ru,盲mang源yuan分fen離li(BlindSourceSeparation)使用一種簡單的線性非混合方法,在麥克風的數量與音源的數量一樣多的條件下,這種方法效果非常理想。
8.將回聲作為獨立的音源來處理
yizhiyilai,renmenliyonghuiboxiaochufangfalaixiaochuhuisheng。zhezhongfangfadeyunsuanliangfeichangda,yinweibixujisuanhuibofanshe,zaizaoshengyuanbianhuahenkuaideshihou,qixingnenghencha。fenzuxiansuoshiwomennengjianghuibozuoweilingwaiyizhongzaoshengyuan。youyuhuibojibuxuyaojinxingjisuan,erqiebuhuigaibianlujing,yincikeyijinxingshunjianyizhi,nengshixiangaoda46dB的回波噪聲抑製性能。
9.采用新的測試標準
yidongtongxinxingyebuduandituijinceshibiaozhunlaibiaoxianchutongguozaizaoshengyizhijishushangdechuangxinshixiangenggaodeyuyinzhiliangdengji。weilebaozhengtamendechanpinhuodezuijiadezhiliang,gaixingyezuijinxiuzhengleITUP.835規範來提供一致的測試方法,對采用了噪聲抑製技術的語音質量進行測試並產生測試報告
- 抑製語音非穩態噪聲的方法
- 使用兩個麥克風來改善對聽覺現場的理解
- 利用分組原理來分隔聲音點
- 減少收斂時間以消除更多的瞬間噪聲
- 采用對數與線性頻率比例
移yi動dong運yun營ying商shang非fei常chang明ming白bai語yu音yin質zhi量liang對dui於yu留liu住zhu用yong戶hu來lai說shuo很hen重zhong要yao。影ying響xiang語yu音yin質zhi量liang的de一yi個ge主zhu要yao因yin素su是shi環huan境jing噪zao聲sheng,因yin此ci任ren何he抑yi製zhi噪zao聲sheng的de方fang法fa對dui於yu手shou機ji製zhi造zao商shang來lai說shuo都dou是shi一yi個ge實shi現xian差cha異yi化hua的de機ji會hui。不bu過guo,直zhi到dao最zui近jin噪zao聲sheng抑yi製zhi技ji術shu還hai隻zhi專zhuan注zhu於yu降jiang低di緩huan慢man變bian化hua的de穩wen態tai噪zao聲sheng源yuan。然ran而er,很hen多duo非fei穩wen態tai噪zao聲sheng源yuan為wei快kuai速su變bian化hua的de,因yin此ci不bu能neng被bei抑yi製zhi。因yin而er,用yong戶hu不bu能neng在zai繁fan忙mang的de大da街jie上shang、擁擠的酒店或者甚至是在家裏可靠地使用他們的手機。
抑(yi)製(zhi)非(fei)穩(wen)態(tai)噪(zao)聲(sheng)對(dui)用(yong)戶(hu)和(he)運(yun)營(ying)商(shang)都(dou)有(you)很(hen)大(da)的(de)好(hao)處(chu)。用(yong)戶(hu)可(ke)以(yi)在(zai)任(ren)何(he)時(shi)候(hou)和(he)任(ren)何(he)地(di)點(dian)自(zi)由(you)清(qing)楚(chu)地(di)通(tong)話(hua),可(ke)以(yi)在(zai)嘈(cao)雜(za)的(de)環(huan)境(jing)中(zhong)低(di)聲(sheng)說(shuo)話(hua)以(yi)保(bao)護(hu)其(qi)隱(yin)私(si),不(bu)會(hui)被(bei)要(yao)求(qiu)離(li)開(kai)重(zhong)要(yao)的(de)電(dian)話(hua)會(hui)議(yi)。運(yun)營(ying)商(shang)會(hui)看(kan)到(dao)丟(diu)失(shi)用(yong)戶(hu)的(de)數(shu)量(liang)降(jiang)低(di),增(zeng)加(jia)通(tong)話(hua)時(shi)間(jian),而(er)且(qie)更(geng)有(you)效(xiao)地(di)使(shi)用(yong)網(wang)絡(luo)帶(dai)寬(kuan),並(bing)大(da)大(da)地(di)節(jie)省(sheng)投(tou)資(zi)和(he)運(yun)營(ying)成(cheng)本(ben)。

圖1.在采用瞬時非穩態噪聲抑製技術前後的時域波形。
1.理解穩態和非穩態噪聲之間的差異
由於其相對穩定的特性—例(li)如(ru)嘈(cao)雜(za)的(de)鼓(gu)風(feng)機(ji)環(huan)境(jing)中(zhong),穩(wen)態(tai)噪(zao)聲(sheng)可(ke)以(yi)很(hen)容(rong)易(yi)地(di)被(bei)識(shi)別(bie),能(neng)用(yong)傳(chuan)統(tong)的(de)新(xin)好(hao)處(chu)理(li)方(fang)法(fa)輕(qing)易(yi)地(di)去(qu)除(chu)。相(xiang)反(fan),非(fei)穩(wen)態(tai)噪(zao)聲(sheng)具(ju)有(you)快(kuai)速(su)或(huo)隨(sui)即(ji)的(de)變(bian)化(hua),例(li)如(ru)一(yi)個(ge)人(ren)的(de)說(shuo)話(hua)聲(sheng)、背景音樂或按鍵音。當非穩態噪聲被作為噪聲識別的時候,這些噪聲實際上已經通過,因此需要更成熟的噪聲抑製方法。
2.使用兩個麥克風來改善對聽覺現場的理解
下一代噪聲抑製技術,例如聽覺場分析(ASA)、波束成形(BF)和盲源隔離(BSS)使用幾個麥克風來更準確地識別、定位以及噪聲源分組,準確性比單個麥克風更高。當今的手機製造商已經意識到這種趨勢,在手機的架構中引入了第二個麥克風。
3.利用分組原理來分隔聲音點
分組方法簡化了噪聲抑製,同時還能確定非穩態噪聲源。例如聽覺場分析(ASA)使用人的聽覺通道作為一個模型,按照人實際對某個聲音的聽覺來處理噪聲。通過多聲學能量進行分組來重新產生原來的聲音,ASA實現了來自多個源的準確分組,同時避免任何聽覺上應該分開的聲音被混合在一起。分組原理可以被大致描述為連續的(在一段時間內發生的)和同時的(在一段頻率內)。
4.使用多個線索來分組,否則難以正確地對聲音進行分組
每一個分組線索都有局限性。使用多個線索能對難以分析的聲音進行正確的分組。某些重要的線索包括:
•聲音的特性:一個音源產生的諧波可以形成清楚的頻率圖,這個頻率圖可以用來對兩個聲音進行區分。聲音特性是區分男人和女人的一個主要線索。
•空間信息:由距離和方向判斷出來的距離可以用來對聲音分組,因而可以對感興趣的聲音進行分辨。
•發出時間:如果兩個聲音能量和他們對應的諧波在時間上一致,他們很可能來自同一個音源。
5.減少收斂時間以消除更多的瞬間噪聲
傳chuan統tong的de噪zao聲sheng抑yi製zhi方fang法fa必bi須xu在zai他ta們men消xiao除chu噪zao聲sheng之zhi前qian收shou斂lian,因yin而er他ta們men在zai抑yi製zhi非fei穩wen態tai噪zao聲sheng源yuan上shang效xiao率lv較jiao低di。通tong過guo利li用yong快kuai速su響xiang應ying的de線xian索suo來lai對dui聲sheng音yin進jin行xing描miao述shu,像xiang打da響xiang指zhi這zhe樣yang的de瞬shun間jian時shi間jian都dou可ke以yi被bei識shi別bie並bing消xiao除chu。
6.采用對數與線性頻率比例(FCTvs.FFT)
熟悉的快速傅立葉變換(FFT)duipinlvfenlianganxianxingbilijinxingfenjie,zheyangxianzhilezaidipinchudepinpufenbianlv,erqieshiyonghendingdezhendaxiaoheduliyupinlvdedaikuan。xiangfande,kuaisuerwobianhuan(FCT)基於人耳蝸的原理,按對數頻率比例變化。這樣一來,它不會限製頻譜分辨率。通過不斷的處理,而不是按幀進行處理,FCT還降低了處理延遲,因此它適合於識別非穩態的噪聲源。此外,FCT工作的帶寬是與頻率相關的,在人耳聽覺範圍內能更準確地匹配時域-頻域折衷。
7.使用全向麥克風來降低成本
像波束成形這類方法需要一種專門的心型曲線式(cardioid,單向)麥克風。這種麥克風的成本比全向麥克風成本更高,具有更低的噪聲容限,必須進行單獨的校準和匹配,誤差要低於1dB,帶來對間隔的限製,由於對風聲和呼吸聲很敏感,因此會增加+12dB的de噪zao聲sheng。波bo束shu成cheng形xing技ji術shu也ye有you其qi局ju限xian性xing,對dui所suo關guan注zhu的de波bo束shu的de任ren何he錯cuo誤wu選xuan擇ze都dou會hui被bei錯cuo誤wu地di傳chuan遞di。對dui一yi個ge係xi統tong所suo需xu要yao的de麥mai克ke風feng的de數shu量liang的de管guan理li也ye很hen重zhong要yao。例li如ru,盲mang源yuan分fen離li(BlindSourceSeparation)使用一種簡單的線性非混合方法,在麥克風的數量與音源的數量一樣多的條件下,這種方法效果非常理想。
8.將回聲作為獨立的音源來處理
yizhiyilai,renmenliyonghuiboxiaochufangfalaixiaochuhuisheng。zhezhongfangfadeyunsuanliangfeichangda,yinweibixujisuanhuibofanshe,zaizaoshengyuanbianhuahenkuaideshihou,qixingnenghencha。fenzuxiansuoshiwomennengjianghuibozuoweilingwaiyizhongzaoshengyuan。youyuhuibojibuxuyaojinxingjisuan,erqiebuhuigaibianlujing,yincikeyijinxingshunjianyizhi,nengshixiangaoda46dB的回波噪聲抑製性能。
9.采用新的測試標準
yidongtongxinxingyebuduandituijinceshibiaozhunlaibiaoxianchutongguozaizaoshengyizhijishushangdechuangxinshixiangenggaodeyuyinzhiliangdengji。weilebaozhengtamendechanpinhuodezuijiadezhiliang,gaixingyezuijinxiuzhengleITUP.835規範來提供一致的測試方法,對采用了噪聲抑製技術的語音質量進行測試並產生測試報告
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 貿澤EIT係列新一期,探索AI如何重塑日常科技與用戶體驗
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 創新不止,創芯不已:第六屆ICDIA創芯展8月南京盛大啟幕!
- AI時代,為什麼存儲基礎設施的可靠性決定數據中心的經濟效益
- 矽典微ONELAB開發係列:為毫米波算法開發者打造的全棧工具鏈
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索





