電子設備中的語音和音頻控製進展
發布時間:2023-06-21 來源:Mouser 責任編輯:wenwei
【導讀】言(yan)語(yu)是(shi)人(ren)們(men)表(biao)達(da)思(si)想(xiang)和(he)願(yuan)望(wang)的(de)一(yi)種(zhong)有(you)效(xiao)方(fang)式(shi)。在(zai)工(gong)業(ye)時(shi)代(dai)到(dao)來(lai)之(zhi)前(qian),人(ren)類(lei)發(fa)現(xian)動(dong)物(wu)可(ke)以(yi)被(bei)訓(xun)練(lian)用(yong)來(lai)識(shi)別(bie)和(he)響(xiang)應(ying)讓(rang)它(ta)們(men)執(zhi)行(xing)某(mou)些(xie)任(ren)務(wu)的(de)基(ji)本(ben)命(ming)令(ling)。
xiayigehehuluojidefazhanyinggaishikaifayizhongshiyongshengyinxinhaoyujiqijinxingjiaoliu,bingzhihuijiqixingdongdefangfa。jinnianlai,yiyuyinheyinpinzuoweidianzishebeidekongzhijiemianyuelaiyueshouhuanying,bingqiezhezhongjishuyezaibuduanfazhan,yimanzuyonghudeqiwanghexinyingyongdeyaoqiu。
在zai本ben文wen中zhong,我wo們men將jiang解jie釋shi用yong語yu音yin和he音yin頻pin信xin號hao控kong製zhi電dian子zi設she備bei和he機ji器qi的de好hao處chu,並bing回hui顧gu如ru何he實shi現xian這zhe種zhong控kong製zhi。我wo們men還hai將jiang展zhan示shi這zhe種zhong控kong製zhi界jie麵mian現xian在zai可ke以yi如ru何he能neng夠gou嵌qian入ru到dao離li線xian設she備bei,以yi及ji它ta們men提ti供gong的de音yin頻pin控kong製zhi體ti驗yan如ru何he能neng夠gou大da幅fu度du改gai善shan。
使用語音控製電子設備
采用語音控製實現與機器交互有幾個明顯好處:
●對人類來說,語音是一種直觀的交流形式,這種口頭傳達指令的方式更容易。
●即(ji)使(shi)一(yi)個(ge)人(ren)的(de)眼(yan)睛(jing)和(he)手(shou)正(zheng)在(zai)用(yong)於(yu)其(qi)它(ta)事(shi)情(qing),語(yu)音(yin)交(jiao)流(liu)仍(reng)然(ran)可(ke)能(neng)。實(shi)時(shi)的(de)語(yu)音(yin)控(kong)製(zhi)也(ye)很(hen)方(fang)便(bian),例(li)如(ru)在(zai)駕(jia)車(che)等(deng)某(mou)些(xie)應(ying)用(yong)場(chang)景(jing)下(xia),試(shi)圖(tu)通(tong)過(guo)觸(chu)摸(mo)來(lai)控(kong)製(zhi)車(che)內(nei)其(qi)它(ta)設(she)備(bei)是(shi)違(wei)法(fa)的(de)。
●語音是控製機器的一種有效媒介,采用語音控製機器,可以在不需要複雜指令的情況下進行監聽和響應。
●在(zai)設(she)備(bei)中(zhong)集(ji)成(cheng)語(yu)音(yin)控(kong)製(zhi)能(neng)夠(gou)最(zui)大(da)限(xian)度(du)地(di)減(jian)少(shao)許(xu)多(duo)設(she)備(bei)對(dui)觸(chu)屏(ping)的(de)需(xu)求(qiu)。這(zhe)對(dui)於(yu)處(chu)於(yu)遠(yuan)程(cheng)或(huo)便(bian)攜(xie)式(shi)電(dian)池(chi)供(gong)電(dian)設(she)備(bei)來(lai)說(shuo)尤(you)其(qi)理(li)想(xiang),在(zai)這(zhe)些(xie)設(she)備(bei)中(zhong),減(jian)小(xiao)尺(chi)寸(cun)和(he)降(jiang)低(di)功(gong)耗(hao)是(shi)常(chang)見(jian)的(de)設(she)計(ji)挑(tiao)戰(zhan)。對(dui)於(yu)具(ju)有(you)多(duo)個(ge)用(yong)戶(hu)的(de)應(ying)用(yong)來(lai)說(shuo),去(qu)掉(diao)觸(chu)屏(ping)控(kong)製(zhi)也(ye)更(geng)加(jia)符(fu)合(he)衛(wei)生(sheng)要(yao)求(qiu)。
●如圖1suoshi,duiyumouxiecanjirenlaishuo,chupingkongzhikenengshiyizhongbuxianshidexuanze,yineryuyinkeyichengweiyizhongyouxiaodezhichigongju。tongguoyuyinyujiqijinxingjiaohukeyongyuzhixingzhurukaimenzhileiderenwu,huozhetongguoyuanchengtongxinlaichuanshugerenzuijindejiankangzhuangkuang。
圖1:聲控機器人助手。(來源:Shutterstock的PaO_STUDIO)
語音控製設備的音頻前端(AFE)包括麥克風陣列和信號處理模塊。AFE能夠處理來自多通道麥克風陣列的信號,以消除任何背景噪聲或設備本身回放產生的幹擾。然後,該信號被發送到“喚醒詞(wake-word)”檢測引擎,例如經過在設備上預先編程,可識別出“Alexa”或“OK Google”等單詞。通過使用多種信號處理算法,能夠消除多種不需要的幹擾信號。語音控製解決方案的組成部分包括:
麥克風陣列:語音激活係統需要一個或多個麥克風來捕獲音頻控製信號。在選擇麥克風陣列時,重要的考慮因素包括尺寸、成本、性能和穩健性。優化組合來自多麥克風陣列的不同信號有助於提高音頻信號鏈的信噪比(SNR)。
到達方向(DoA)檢測器:用於確定用戶相對於被控設備的位置,以便麥克風陣列可以將波束調整為語音的方向。
波束成形器:它接受來自DoA檢測器的聲音,同時去除來自其他方向的聲音。其性能取決於麥克風陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。
聲學回聲消除器(AEC):它會消除設備揚聲器本身的播放信號(例如,設備揚聲器正在播放音樂時收到語音指令),以便清晰地拾取用戶語音指令。
自適應幹擾消除器(AIC):它能夠消除來自其他聲音源的外部噪聲,這些噪聲很難用傳統的波束成形器消除,例如,其他設備產生的較大噪聲。
喚醒詞檢測器:將來自AFE的經過處理語音信號與喚醒詞庫進行比較,例如可使用喚醒詞檢測算法的“Hey Google”,這種算法通常是機器學習模型的一部分。更大的模型則更準確,例如,1MB訓練模型比64kB模型更準確,但處理強度更大。需要大的喚醒詞模型來準確地檢測喚醒詞,從而減少錯誤警報的數量。
D類音頻放大器
該(gai)控(kong)製(zhi)界(jie)麵(mian)的(de)語(yu)音(yin)處(chu)理(li)部(bu)分(fen)經(jing)過(guo)大(da)量(liang)開(kai)發(fa),現(xian)在(zai)即(ji)使(shi)是(shi)低(di)成(cheng)本(ben)的(de)設(she)備(bei)也(ye)能(neng)提(ti)供(gong)準(zhun)確(que)的(de)語(yu)音(yin)識(shi)別(bie)能(neng)力(li)。然(ran)而(er),界(jie)麵(mian)的(de)音(yin)頻(pin)端(duan)受(shou)到(dao)的(de)關(guan)注(zhu)明(ming)顯(xian)較(jiao)少(shao),這(zhe)意(yi)味(wei)著(zhe)與(yu)高(gao)端(duan)音(yin)頻(pin)設(she)備(bei)相(xiang)比(bi),許(xu)多(duo)早(zao)期(qi)智(zhi)能(neng)揚(yang)聲(sheng)器(qi)和(he)其(qi)他(ta)支(zhi)持(chi)音(yin)頻(pin)的(de)物(wu)聯(lian)網(wang)(IoT)設備所產生的音質較差。
與yu語yu音yin控kong製zhi相xiang關guan的de任ren何he新xin產chan品pin都dou可ke能neng被bei認ren為wei分fen散san了le人ren們men對dui這zhe些xie缺que點dian的de關guan注zhu。然ran而er,隨sui著zhe智zhi能neng設she備bei越yue來lai越yue廣guang泛fan采cai用yong,消xiao費fei者zhe對dui其qi提ti供gong的de音yin頻pin體ti驗yan期qi望wang也ye越yue來lai越yue高gao。傳chuan統tongAB類音頻放大器的低效率使其無法用於低功率物聯網設備,幸運的是,幾家芯片製造商最近推出了一係列高級D類lei音yin頻pin放fang大da器qi,體ti現xian了le對dui以yi前qian可ke用yong音yin頻pin放fang大da器qi的de重zhong大da改gai進jin,其qi中zhong許xu多duo產chan品pin都dou是shi專zhuan門men為wei在zai智zhi能neng技ji術shu和he物wu聯lian網wang設she備bei中zhong實shi現xian高gao品pin質zhi音yin頻pin而er開kai發fa。
德州儀器 (Texas Instruments)的TAS2770 15W輸入音頻放大器能夠提高響度和音頻質量,它具有更強的語音捕獲能力,意味著語音控製設備的操作更容易、更自然。Maxim Integrated(現在屬於Analog Devices旗下品牌)開發了MAX98357 和MAX98358 D類放大器,效率達到92%,可提供3.2W的AB類音頻性能,這些放大器的簡化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V鋰離子電池驅動的設備中很好地運行。
圖2:Maxim Integrated D類音頻放大器簡化框圖。(來源:Maxim Integrated)
離線語音控製
亞馬遜的Alexa和穀歌助手(Google Assistant)等deng基ji於yu雲yun的de解jie決jue方fang案an很hen容rong易yi用yong於yu具ju有you穩wen定ding互hu聯lian網wang連lian接jie的de設she備bei,但dan對dui於yu那na些xie沒mei有you穩wen定ding互hu聯lian網wang或huo根gen本ben沒mei有you連lian接jie的de設she備bei來lai說shuo,離li線xian語yu音yin控kong製zhi則ze是shi一yi個ge更geng好hao的de解jie決jue方fang案an。例li如ru,如ru果guo某mou個ge產chan品pin需xu要yao響xiang應ying簡jian單dan的de單dan詞ci指zhi令ling,如rugo、stop、reset等(通常稱為關鍵字識別),那麼在設備本身進行本地處理則很有意義。使用低成本的嵌入式微控製器可以實現簡單的關鍵字指令係統,例如可使用恩智浦(NXP)基於EdgeReady MCU的離線本地語音控製解決方案。它采用i.MX RT交叉MCU,開發人員能夠快速將語音控製集成到他們的產品中。恩智浦基於i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開發工具包,如圖3所示。
該開發工具包配備了在FreeRTOS上運行的全部集成軟件,並提供有軟件開發工具包(SDK),以便快速驗證概念。離線語音控製也有助於解決許多消費者的隱私問題,因為他們擔心自己的係統容易受到在線黑客的攻擊。
圖3:恩智浦的SLN-LOCAL2-IOT離線語音控製解決方案。(來源:恩智浦)
結論
語yu音yin和he音yin頻pin正zheng在zai快kuai速su成cheng為wei許xu多duo智zhi能neng設she備bei的de首shou選xuan控kong製zhi界jie麵mian,這zhe種zhong技ji術shu尤you其qi適shi合he在zai低di功gong耗hao和he便bian攜xie式shi物wu聯lian網wang設she備bei中zhong使shi用yong,因yin為wei它ta能neng夠gou消xiao除chu對dui昂ang貴gui且qie耗hao電dian的de數shu字zi顯xian示shi器qi的de要yao求qiu。許xu多duo早zao期qi係xi統tong的de音yin頻pin質zhi量liang較jiao差cha,隻zhi能neng使shi用yong雲yun連lian接jie解jie決jue方fang案an來lai實shi現xian。
然而,隨著新一代高效D類(lei)音(yin)頻(pin)放(fang)大(da)器(qi)的(de)出(chu)現(xian),使(shi)製(zhi)造(zao)商(shang)能(neng)夠(gou)確(que)保(bao)其(qi)設(she)備(bei)為(wei)消(xiao)費(fei)者(zhe)提(ti)供(gong)高(gao)質(zhi)量(liang)的(de)音(yin)頻(pin)體(ti)驗(yan)。而(er)且(qie)現(xian)在(zai)也(ye)可(ke)提(ti)供(gong)一(yi)些(xie)其(qi)它(ta)解(jie)決(jue)方(fang)案(an),能(neng)夠(gou)在(zai)互(hu)聯(lian)網(wang)連(lian)接(jie)不(bu)穩(wen)定(ding)或(huo)根(gen)本(ben)沒(mei)有(you)互(hu)聯(lian)網(wang)連(lian)接(jie)的(de)情(qing)況(kuang)下(xia)實(shi)現(xian)設(she)備(bei)的(de)語(yu)音(yin)控(kong)製(zhi)。這(zhe)些(xie)創(chuang)新(xin)表(biao)明(ming),隨(sui)著(zhe)人(ren)們(men)越(yue)來(lai)越(yue)習(xi)慣(guan)這(zhe)種(zhong)控(kong)製(zhi)界(jie)麵(mian),語(yu)音(yin)控(kong)製(zhi)技(ji)術(shu)有(you)能(neng)力(li)適(shi)應(ying)新(xin)的(de)需(xu)求(qiu),而(er)且(qie)這(zhe)種(zhong)發(fa)展(zhan)趨(qu)勢(shi)還(hai)會(hui)不(bu)斷(duan)繼(ji)續(xu)。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 貿澤EIT係列新一期,探索AI如何重塑日常科技與用戶體驗
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 創新不止,創芯不已:第六屆ICDIA創芯展8月南京盛大啟幕!
- AI時代,為什麼存儲基礎設施的可靠性決定數據中心的經濟效益
- 矽典微ONELAB開發係列:為毫米波算法開發者打造的全棧工具鏈
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




