使用POWERPRO降低動態功耗簡介
發布時間:2020-05-12 來源:ELLIE BURNS,ABHISHEK RANJAN 責任編輯:wenwei
【導讀】一直以來,設計人員都將最小化功耗的工作留給實現/物(wu)理(li)工(gong)具(ju)來(lai)完(wan)成(cheng)。但(dan)到(dao)了(le)這(zhe)個(ge)時(shi)候(hou),有(you)關(guan)設(she)計(ji)的(de)所(suo)有(you)重(zhong)要(yao)架(jia)構(gou)和(he)微(wei)架(jia)構(gou)決(jue)策(ce)都(dou)已(yi)確(que)定(ding)。物(wu)理(li)工(gong)具(ju)對(dui)功(gong)耗(hao)的(de)影(ying)響(xiang)非(fei)常(chang)有(you)限(xian)。這(zhe)些(xie)工(gong)具(ju)無(wu)法(fa)對(dui)設(she)計(ji)架(jia)構(gou)進(jin)行(xing)徹(che)底(di)的(de)更(geng)改(gai),從(cong)而(er)實(shi)現(xian)節(jie)能(neng)。物(wu)理(li)工(gong)具(ju)所(suo)用(yong)的(de)方(fang)法(fa),例(li)如(ru)單(dan)元(yuan)尺(chi)寸(cun)調(tiao)整(zheng)、管腳交換和 Vth 選擇,隻能將稍稍降低功耗而已。
UPF 主zhu要yao用yong於yu增zeng強qiang漏lou泄xie功gong耗hao的de功gong率lv門men控kong,其qi主zhu要yao用yong途tu是shi定ding義yi電dian壓ya域yu。指zhi定ding不bu同tong電dian壓ya域yu的de其qi中zhong一yi個ge原yuan因yin是shi為wei了le協xie商shang功gong耗hao與yu性xing能neng之zhi間jian的de折zhe衷zhong方fang案an。較jiao高gao的de電dian壓ya可ke獲huo得de更geng快kuai的de速su度du,但dan需xu要yao更geng高gao的de動dong態tai功gong耗hao (1/2 C V2 f)。
gonghaoyudianyadepingfangchengzhengbi。yinci,jiangdidongtaigonghaoyaocongzhenduishejizhongdebutongmokuaiguihuaheshidedianyadianpingkaishi。dongtaigonghaozhuyaoshouhuodongyingxiang。shejizhongyunxingdegongzuoyueduo,zuizhongxuyaodenengliangjiuyueduo。suizhezaishejizhongwanchenggongzuodesudutigao,suoxugonghaoyehuizengjia。yaojieshengdongtaigonghao,keyijiangdishejidegongzuosudu(降低時鍾速度),嚐chang試shi降jiang低di電dian壓ya,或huo嚐chang試shi削xue減jian設she計ji活huo動dong。減jian小xiao設she計ji中zhong的de電dian容rong是shi節jie能neng的de另ling一yi個ge重zhong要yao方fang麵mian,這zhe通tong常chang可ke借jie助zhu高gao效xiao的de實shi施shi或huo通tong過guo調tiao整zheng工gong藝yi來lai實shi現xian。
一般而言,設計架構師比較擅長確定電壓和時鍾速度。但目前為止,還未找到減少活動(尤其是不必要的活動)的有效做法。此類縮減往往需要微架構更改(例如 FSM 重新編碼、模塊級時鍾門控、存儲器門控、存儲器分塊和旁路存儲器訪問),而這類更改要求深入了解設計功能。這類更改適合由編寫 RTL 的設計人員來執行。
在(zai)許(xu)多(duo)公(gong)司(si),降(jiang)低(di)功(gong)耗(hao)的(de)工(gong)作(zuo)交(jiao)給(gei)功(gong)耗(hao)專(zhuan)家(jia)完(wan)成(cheng)。這(zhe)些(xie)專(zhuan)家(jia)具(ju)備(bei)多(duo)年(nian)積(ji)累(lei)的(de)反(fan)複(fu)應(ying)用(yong)於(yu)所(suo)在(zai)業(ye)務(wu)組(zu)設(she)計(ji)的(de)知(zhi)識(shi)和(he)方(fang)法(fa)。但(dan)這(zhe)種(zhong)方(fang)法(fa)非(fei)常(chang)狹(xia)隘(ai),無(wu)法(fa)在(zai)公(gong)司(si)內(nei)多(duo)個(ge)業(ye)務(wu)組(zu)之(zhi)間(jian)拓(tuo)展(zhan)。
公司開始認識到這一方法的局限性。於是越來越多的 RTL shejirenyuancongyikaishibianchengdanlejiejuegonghaowentiderenwu。lixiangqingkuangxiayuanbenjiuyingruci。lejieshejiderenyuanshijinxinggonghaoyouhuadezuijiarenxuan。erqie,zaishejizhuanxiang FinFET 技術的過程中,動態功耗已成為功耗的主導因素(圖 1)。

圖 1:功耗趨勢。
降低 RTL 動態功耗的常用方法
在 RTL 做出的決定對設計功耗的影響遠大於在設計流程後期做出的決定。RTL 設計人員嚴重依賴時鍾門控來削減時鍾翻轉。這是目前占絕對優勢的降低動態功耗的最常用方法。RTL 設計人員使用的一些其他方法包括數據門控和觸發器克隆/共享(圖 2)。

圖 2:克隆觸發器方法。
圖 2 顯示:
• 觸發器 F 提供了用於 3 種算術運算的運算符。
• 觸發器 F 無法進行門控,因為至少一種算術運算需要它的值。
• 即便執行一種運算,另外兩種運算中的邏輯也會發生不必要的翻轉並產生功耗。
• 通過將觸發器 F 克隆到三個觸發器(F1、F2 和 F3)中,可在對兩種運算進行門控的同時計算第三種運算。
通過這一更改,設計人員需要確認額外觸發器的功耗要遠小於它們所控製的下遊算術運算功耗。
要對功耗產生更深刻的影響,RTL 設計人員需要在設計中進行越來越多的粗粒度(微架構)更改。例如,通過以下方法可顯著削減動態功耗:
• 模塊級的時鍾門控
• 將寄存器鏈轉換為環形緩衝器
• 關斷存儲器
• 旁路存儲器訪問
• 執行重定時
• 使用運算符屏蔽。
將(jiang)移(yi)位(wei)寄(ji)存(cun)器(qi)替(ti)換(huan)為(wei)環(huan)形(xing)緩(huan)衝(chong)器(qi)是(shi)一(yi)種(zhong)常(chang)見(jian)的(de)微(wei)架(jia)構(gou)設(she)計(ji)更(geng)改(gai)。移(yi)位(wei)寄(ji)存(cun)器(qi)中(zhong)的(de)活(huo)動(dong)量(liang)很(hen)大(da),因(yin)為(wei)沿(yan)著(zhe)接(jie)收(shou)新(xin)值(zhi)的(de)觸(chu)發(fa)器(qi)鏈(lian),數(shu)據(ju)一(yi)直(zhi)都(dou)在(zai)進(jin)行(xing)移(yi)位(wei)。這(zhe)一(yi)移(yi)位(wei)操(cao)作(zuo)導(dao)致(zhi)觸(chu)發(fa)器(qi)(以及這些觸發器所驅動的邏輯中)發生多次不必要的翻轉並造成功耗。因此,設計人員考慮將移位寄存器替換為環形緩衝器(圖 3),因為這些緩衝器在讀取或使用新值時不需要移動。

圖 3:將移位寄存器替換為環形緩衝器。
進行這一更改後,設計人員需要確認在環形緩衝器內添加讀/寫指針邏輯產生的功耗不會超過通過使用環形緩衝器節省的功耗。
由於在任意給定的時間間隔,僅僅訪問總計地址中的少數幾個地址,因此存儲器會浪費功率。為解決此問題,設計人員可使用較小的“分塊”實施總體存儲器,這些分塊在未被訪問時可予以關斷(圖 4)。

圖 4:存儲器分塊示例。
圖 4 顯示了對一個 1024 字存儲器進行分塊的兩種方法:
1. 兩個 512 字的分塊:僅其中一個分塊處於主動被訪問狀態,另一個分塊則通過門控關斷以節省功耗。
2. 四個 256 字的分塊:任意時刻有三個分塊可處於門控關斷狀態。
另一種設計存儲器以節省功耗的方法是通過一組固定寬度的存儲塊來配置所需的存儲器字大小。在圖 5 所示的示例中,有多種實現 512 字 X 28 位存儲器的方法,圖中提供了兩種:
1. 剛好使用 28 位字大小 (16 + 8 + 4) 並插入額外的編碼邏輯,用於在兩個分塊之間做出選擇(圖 5 右上角)。
2. 使用單個 32 位存儲器元器件(圖 5 右下角)。盡管此解決方案不需要任何編碼邏輯,但有 4 位存儲器被浪費。

圖 5:可能的存儲器配置。
不論設計人員采用哪種方法來降低存儲器功耗,都必須非常小心,確保額外解碼邏輯的功耗仍小於較大的原始存儲塊功耗。
遺憾的是,前述方法的接受度遠不如預期。主要有兩個原因:
• 不容易了解設計中存在這類機會。
• 不容易了解通過做出更改將會降低多少功耗。
通tong常chang,設she計ji人ren員yuan依yi賴lai他ta們men的de經jing驗yan或huo直zhi覺jiao做zuo出chu設she計ji更geng改gai。他ta們men載zai入ru仿fang真zhen波bo形xing,並bing嚐chang試shi估gu計ji其qi設she計ji中zhong可ke能neng出chu現xian冗rong餘yu活huo動dong的de位wei置zhi。然ran後hou,根gen據ju此ci類lei活huo動dong所suo在zai的de區qu域yu,嚐chang試shi評ping估gu可ke減jian少shao浪lang費fei活huo動dong的de方fang法fa。對dui一yi般ban RTL 設計人員而言,這樣未免要求過高。因此,很多功耗節省未能付諸實施。使用 PowerPro® 提供了一種解決方案。
使用 POWERPRO 降低動態功耗
很顯然,傳統的降低功耗方法已經不再行得通。遷移到 FinFET geidongtaigonghaodailaileyurijuzengdeyanjuntiaozhan。weibaochijingzhengyoushi,danchunyilaigonghaozhuanjialaijiangdigonghaoyijingyuanyuanbugoule。gongsijianghuizaigonghaofangmianluohouyujingzhengduishou。
簡jian單dan地di報bao告gao設she計ji的de功gong耗hao數shu字zi已yi不bu再zai適shi宜yi。功gong耗hao分fen析xi是shi一yi個ge重zhong要yao的de步bu驟zhou,但dan它ta本ben身shen並bing不bu能neng節jie省sheng任ren何he功gong耗hao。最zui終zhong要yao取qu決jue於yu設she計ji人ren員yuan個ge人ren的de專zhuan業ye知zhi識shi,以yi及ji他ta們men如ru何he解jie讀du工gong具ju報bao告gao從cong而er優you化hua功gong耗hao設she計ji。
RTL 設計人員需要關於設計中哪些位置可以節省功耗的指導。他們需要關於其設計中存在的優化範圍(例如模塊級時鍾門控、移位寄存器到環形緩衝器、存儲器緩存和複位移除)及相關功耗節省的確鑿證據。PowerPro 在(zai)設(she)計(ji)中(zhong)提(ti)供(gong)了(le)進(jin)行(xing)許(xu)多(duo)微(wei)架(jia)構(gou)和(he)細(xi)粒(li)度(du)優(you)化(hua)的(de)可(ke)能(neng)性(xing),並(bing)且(qie)呈(cheng)現(xian)了(le)與(yu)每(mei)項(xiang)更(geng)改(gai)相(xiang)關(guan)的(de)實(shi)際(ji)功(gong)耗(hao)節(jie)省(sheng)。與(yu)手(shou)動(dong)方(fang)法(fa)相(xiang)比(bi),其(qi)可(ke)最(zui)大(da)限(xian)度(du)減(jian)少(shao)了(le)花(hua)費(fei)在(zai)做(zuo)出(chu)設(she)計(ji)決(jue)策(ce)上(shang)的(de)時(shi)間(jian)。基(ji)於(yu) PowerPro 的de建jian議yi,設she計ji人ren員yuan可ke根gen據ju其qi設she計ji進jin度du做zuo出chu更geng改gai。如ru果guo依yi據ju進jin度du還hai有you足zu夠gou的de時shi間jian,他ta們men可ke以yi實shi施shi所suo有you建jian議yi。如ru果guo時shi間jian有you限xian,設she計ji人ren員yuan可ke以yi選xuan取qu最zui佳jia建jian議yi加jia以yi實shi施shi。在zai設she計ji流liu程cheng中zhong采cai用yong PowerPro 時,這一靈活性至關重要。
功耗優化的另一個關鍵部分是探索各種更改(例如工作模式、時鍾頻率、工作電壓和工藝技術)對應的功耗的能力,對於 IP 開發人員而言尤其如此。建議的優化應適用於上述所有參數。利用 PowerPro,設計人員可以探索仿真配置文件、電壓、時鍾速度和設計自身的更改。在 PowerPro 內可以並行評估以上多種更改(圖 6)。因此,過去需要幾周才能完成的探索任務,現在隻要幾個小時就能完成。這種生產率提升讓 PowerPro 成為極具吸引力的設計流程補充。

圖 6:PowerPro 功耗探索。
檢測功率冗餘的基礎技術是形式化分析。PowerPro 對設計執行深入的時序分析,以找出存儲器訪問、寄存器載入和數據路徑計算中存在的冗餘。由於 PowerPro 能夠基於時序探索建議修改,因此遠優於市場中的同類競爭技術。PowerPro 可針對設計流程的所有方麵提供支持,包括寫出優化的 RTL、ECO 和驗證。設計人員確信,他們可以接受源自 PowerPro 的所有建議,並且不會對其交付進度產生任何不利影響。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
微波功率管
微波開關
微波連接器
微波器件
微波三極管
微波振蕩器
微電機
微調電容
微動開關
微蜂窩
位置傳感器
溫度保險絲
溫度傳感器
溫控開關
溫控可控矽
聞泰
穩壓電源
穩壓二極管
穩壓管
無焊端子
無線充電
無線監控
無源濾波器
五金工具
物聯網
顯示模塊
顯微鏡結構
線圈
線繞電位器
線繞電阻



