使用POWERPRO降低動態功耗簡介
發布時間:2020-05-12 來源:ELLIE BURNS,ABHISHEK RANJAN 責任編輯:wenwei
【導讀】一直以來,設計人員都將最小化功耗的工作留給實現/物(wu)理(li)工(gong)具(ju)來(lai)完(wan)成(cheng)。但(dan)到(dao)了(le)這(zhe)個(ge)時(shi)候(hou),有(you)關(guan)設(she)計(ji)的(de)所(suo)有(you)重(zhong)要(yao)架(jia)構(gou)和(he)微(wei)架(jia)構(gou)決(jue)策(ce)都(dou)已(yi)確(que)定(ding)。物(wu)理(li)工(gong)具(ju)對(dui)功(gong)耗(hao)的(de)影(ying)響(xiang)非(fei)常(chang)有(you)限(xian)。這(zhe)些(xie)工(gong)具(ju)無(wu)法(fa)對(dui)設(she)計(ji)架(jia)構(gou)進(jin)行(xing)徹(che)底(di)的(de)更(geng)改(gai),從(cong)而(er)實(shi)現(xian)節(jie)能(neng)。物(wu)理(li)工(gong)具(ju)所(suo)用(yong)的(de)方(fang)法(fa),例(li)如(ru)單(dan)元(yuan)尺(chi)寸(cun)調(tiao)整(zheng)、管腳交換和 Vth 選擇,隻能將稍稍降低功耗而已。
UPF zhuyaoyongyuzengqianglouxiegonghaodegonglvmenkong,qizhuyaoyongtushidingyidianyayu。zhidingbutongdianyayudeqizhongyigeyuanyinshiweilexieshanggonghaoyuxingnengzhijiandezhezhongfangan。jiaogaodedianyakehuodegengkuaidesudu,danxuyaogenggaodedongtaigonghao (1/2 C V2 f)。
功(gong)耗(hao)與(yu)電(dian)壓(ya)的(de)平(ping)方(fang)成(cheng)正(zheng)比(bi)。因(yin)此(ci),降(jiang)低(di)動(dong)態(tai)功(gong)耗(hao)要(yao)從(cong)針(zhen)對(dui)設(she)計(ji)中(zhong)的(de)不(bu)同(tong)模(mo)塊(kuai)規(gui)劃(hua)合(he)適(shi)的(de)電(dian)壓(ya)電(dian)平(ping)開(kai)始(shi)。動(dong)態(tai)功(gong)耗(hao)主(zhu)要(yao)受(shou)活(huo)動(dong)影(ying)響(xiang)。設(she)計(ji)中(zhong)運(yun)行(xing)的(de)工(gong)作(zuo)越(yue)多(duo),最(zui)終(zhong)需(xu)要(yao)的(de)能(neng)量(liang)就(jiu)越(yue)多(duo)。隨(sui)著(zhe)在(zai)設(she)計(ji)中(zhong)完(wan)成(cheng)工(gong)作(zuo)的(de)速(su)度(du)提(ti)高(gao),所(suo)需(xu)功(gong)耗(hao)也(ye)會(hui)增(zeng)加(jia)。要(yao)節(jie)省(sheng)動(dong)態(tai)功(gong)耗(hao),可(ke)以(yi)降(jiang)低(di)設(she)計(ji)的(de)工(gong)作(zuo)速(su)度(du)(降低時鍾速度),嚐(chang)試(shi)降(jiang)低(di)電(dian)壓(ya),或(huo)嚐(chang)試(shi)削(xue)減(jian)設(she)計(ji)活(huo)動(dong)。減(jian)小(xiao)設(she)計(ji)中(zhong)的(de)電(dian)容(rong)是(shi)節(jie)能(neng)的(de)另(ling)一(yi)個(ge)重(zhong)要(yao)方(fang)麵(mian),這(zhe)通(tong)常(chang)可(ke)借(jie)助(zhu)高(gao)效(xiao)的(de)實(shi)施(shi)或(huo)通(tong)過(guo)調(tiao)整(zheng)工(gong)藝(yi)來(lai)實(shi)現(xian)。
一般而言,設計架構師比較擅長確定電壓和時鍾速度。但目前為止,還未找到減少活動(尤其是不必要的活動)的有效做法。此類縮減往往需要微架構更改(例如 FSM 重新編碼、模塊級時鍾門控、存儲器門控、存儲器分塊和旁路存儲器訪問),而這類更改要求深入了解設計功能。這類更改適合由編寫 RTL 的設計人員來執行。
zaixuduogongsi,jiangdigonghaodegongzuojiaogeigonghaozhuanjiawancheng。zhexiezhuanjiajubeiduonianjileidefanfuyingyongyusuozaiyewuzushejidezhishihefangfa。danzhezhongfangfafeichangxiaai,wufazaigongsineiduogeyewuzuzhijiantuozhan。
公司開始認識到這一方法的局限性。於是越來越多的 RTL 設(she)計(ji)人(ren)員(yuan)從(cong)一(yi)開(kai)始(shi)便(bian)承(cheng)擔(dan)了(le)解(jie)決(jue)功(gong)耗(hao)問(wen)題(ti)的(de)任(ren)務(wu)。理(li)想(xiang)情(qing)況(kuang)下(xia)原(yuan)本(ben)就(jiu)應(ying)如(ru)此(ci)。了(le)解(jie)設(she)計(ji)的(de)人(ren)員(yuan)是(shi)進(jin)行(xing)功(gong)耗(hao)優(you)化(hua)的(de)最(zui)佳(jia)人(ren)選(xuan)。而(er)且(qie),在(zai)設(she)計(ji)轉(zhuan)向(xiang) FinFET 技術的過程中,動態功耗已成為功耗的主導因素(圖 1)。

圖 1:功耗趨勢。
降低 RTL 動態功耗的常用方法
在 RTL 做出的決定對設計功耗的影響遠大於在設計流程後期做出的決定。RTL 設計人員嚴重依賴時鍾門控來削減時鍾翻轉。這是目前占絕對優勢的降低動態功耗的最常用方法。RTL 設計人員使用的一些其他方法包括數據門控和觸發器克隆/共享(圖 2)。

圖 2:克隆觸發器方法。
圖 2 顯示:
• 觸發器 F 提供了用於 3 種算術運算的運算符。
• 觸發器 F 無法進行門控,因為至少一種算術運算需要它的值。
• 即便執行一種運算,另外兩種運算中的邏輯也會發生不必要的翻轉並產生功耗。
• 通過將觸發器 F 克隆到三個觸發器(F1、F2 和 F3)中,可在對兩種運算進行門控的同時計算第三種運算。
通過這一更改,設計人員需要確認額外觸發器的功耗要遠小於它們所控製的下遊算術運算功耗。
要對功耗產生更深刻的影響,RTL 設計人員需要在設計中進行越來越多的粗粒度(微架構)更改。例如,通過以下方法可顯著削減動態功耗:
• 模塊級的時鍾門控
• 將寄存器鏈轉換為環形緩衝器
• 關斷存儲器
• 旁路存儲器訪問
• 執行重定時
• 使用運算符屏蔽。
將jiang移yi位wei寄ji存cun器qi替ti換huan為wei環huan形xing緩huan衝chong器qi是shi一yi種zhong常chang見jian的de微wei架jia構gou設she計ji更geng改gai。移yi位wei寄ji存cun器qi中zhong的de活huo動dong量liang很hen大da,因yin為wei沿yan著zhe接jie收shou新xin值zhi的de觸chu發fa器qi鏈lian,數shu據ju一yi直zhi都dou在zai進jin行xing移yi位wei。這zhe一yi移yi位wei操cao作zuo導dao致zhi觸chu發fa器qi(以及這些觸發器所驅動的邏輯中)發生多次不必要的翻轉並造成功耗。因此,設計人員考慮將移位寄存器替換為環形緩衝器(圖 3),因為這些緩衝器在讀取或使用新值時不需要移動。

圖 3:將移位寄存器替換為環形緩衝器。
進行這一更改後,設計人員需要確認在環形緩衝器內添加讀/寫指針邏輯產生的功耗不會超過通過使用環形緩衝器節省的功耗。
由於在任意給定的時間間隔,僅僅訪問總計地址中的少數幾個地址,因此存儲器會浪費功率。為解決此問題,設計人員可使用較小的“分塊”實施總體存儲器,這些分塊在未被訪問時可予以關斷(圖 4)。

圖 4:存儲器分塊示例。
圖 4 顯示了對一個 1024 字存儲器進行分塊的兩種方法:
1. 兩個 512 字的分塊:僅其中一個分塊處於主動被訪問狀態,另一個分塊則通過門控關斷以節省功耗。
2. 四個 256 字的分塊:任意時刻有三個分塊可處於門控關斷狀態。
另一種設計存儲器以節省功耗的方法是通過一組固定寬度的存儲塊來配置所需的存儲器字大小。在圖 5 所示的示例中,有多種實現 512 字 X 28 位存儲器的方法,圖中提供了兩種:
1. 剛好使用 28 位字大小 (16 + 8 + 4) 並插入額外的編碼邏輯,用於在兩個分塊之間做出選擇(圖 5 右上角)。
2. 使用單個 32 位存儲器元器件(圖 5 右下角)。盡管此解決方案不需要任何編碼邏輯,但有 4 位存儲器被浪費。

圖 5:可能的存儲器配置。
不論設計人員采用哪種方法來降低存儲器功耗,都必須非常小心,確保額外解碼邏輯的功耗仍小於較大的原始存儲塊功耗。
遺憾的是,前述方法的接受度遠不如預期。主要有兩個原因:
• 不容易了解設計中存在這類機會。
• 不容易了解通過做出更改將會降低多少功耗。
tongchang,shejirenyuanyilaitamendejingyanhuozhijiaozuochushejigenggai。tamenzairufangzhenboxing,bingchangshigujiqishejizhongkenengchuxianrongyuhuodongdeweizhi。ranhou,genjucileihuodongsuozaidequyu,changshipinggukejianshaolangfeihuodongdefangfa。duiyiban RTL 設計人員而言,這樣未免要求過高。因此,很多功耗節省未能付諸實施。使用 PowerPro® 提供了一種解決方案。
使用 POWERPRO 降低動態功耗
很顯然,傳統的降低功耗方法已經不再行得通。遷移到 FinFET 給gei動dong態tai功gong耗hao帶dai來lai了le與yu日ri俱ju增zeng的de嚴yan峻jun挑tiao戰zhan。為wei保bao持chi競jing爭zheng優you勢shi,單dan純chun依yi賴lai功gong耗hao專zhuan家jia來lai降jiang低di功gong耗hao已yi經jing遠yuan遠yuan不bu夠gou了le。公gong司si將jiang會hui在zai功gong耗hao方fang麵mian落luo後hou於yu競jing爭zheng對dui手shou。
簡(jian)單(dan)地(di)報(bao)告(gao)設(she)計(ji)的(de)功(gong)耗(hao)數(shu)字(zi)已(yi)不(bu)再(zai)適(shi)宜(yi)。功(gong)耗(hao)分(fen)析(xi)是(shi)一(yi)個(ge)重(zhong)要(yao)的(de)步(bu)驟(zhou),但(dan)它(ta)本(ben)身(shen)並(bing)不(bu)能(neng)節(jie)省(sheng)任(ren)何(he)功(gong)耗(hao)。最(zui)終(zhong)要(yao)取(qu)決(jue)於(yu)設(she)計(ji)人(ren)員(yuan)個(ge)人(ren)的(de)專(zhuan)業(ye)知(zhi)識(shi),以(yi)及(ji)他(ta)們(men)如(ru)何(he)解(jie)讀(du)工(gong)具(ju)報(bao)告(gao)從(cong)而(er)優(you)化(hua)功(gong)耗(hao)設(she)計(ji)。
RTL 設計人員需要關於設計中哪些位置可以節省功耗的指導。他們需要關於其設計中存在的優化範圍(例如模塊級時鍾門控、移位寄存器到環形緩衝器、存儲器緩存和複位移除)及相關功耗節省的確鑿證據。PowerPro zaishejizhongtigonglejinxingxuduoweijiagouhexiliduyouhuadekenengxing,bingqiechengxianleyumeixianggenggaixiangguandeshijigonghaojiesheng。yushoudongfangfaxiangbi,qikezuidaxiandujianshaolehuafeizaizuochushejijueceshangdeshijian。jiyu PowerPro 的(de)建(jian)議(yi),設(she)計(ji)人(ren)員(yuan)可(ke)根(gen)據(ju)其(qi)設(she)計(ji)進(jin)度(du)做(zuo)出(chu)更(geng)改(gai)。如(ru)果(guo)依(yi)據(ju)進(jin)度(du)還(hai)有(you)足(zu)夠(gou)的(de)時(shi)間(jian),他(ta)們(men)可(ke)以(yi)實(shi)施(shi)所(suo)有(you)建(jian)議(yi)。如(ru)果(guo)時(shi)間(jian)有(you)限(xian),設(she)計(ji)人(ren)員(yuan)可(ke)以(yi)選(xuan)取(qu)最(zui)佳(jia)建(jian)議(yi)加(jia)以(yi)實(shi)施(shi)。在(zai)設(she)計(ji)流(liu)程(cheng)中(zhong)采(cai)用(yong) PowerPro 時,這一靈活性至關重要。
功耗優化的另一個關鍵部分是探索各種更改(例如工作模式、時鍾頻率、工作電壓和工藝技術)對應的功耗的能力,對於 IP 開發人員而言尤其如此。建議的優化應適用於上述所有參數。利用 PowerPro,設計人員可以探索仿真配置文件、電壓、時鍾速度和設計自身的更改。在 PowerPro 內可以並行評估以上多種更改(圖 6)。因此,過去需要幾周才能完成的探索任務,現在隻要幾個小時就能完成。這種生產率提升讓 PowerPro 成為極具吸引力的設計流程補充。

圖 6:PowerPro 功耗探索。
檢測功率冗餘的基礎技術是形式化分析。PowerPro 對設計執行深入的時序分析,以找出存儲器訪問、寄存器載入和數據路徑計算中存在的冗餘。由於 PowerPro 能夠基於時序探索建議修改,因此遠優於市場中的同類競爭技術。PowerPro 可針對設計流程的所有方麵提供支持,包括寫出優化的 RTL、ECO 和驗證。設計人員確信,他們可以接受源自 PowerPro 的所有建議,並且不會對其交付進度產生任何不利影響。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索




