瞬變對AI加速卡供電的影響
發布時間:2023-11-19 來源:ADI 責任編輯:wenwei
【導讀】圖形處理單元(GPU)、張量處理單元(TPU)和其他類型的專用集成電路(ASIC)通過提供並行處理能力來實現高性能計算,以滿足加速人工智能(AI)訓練和推理工作負載的需求。
AI需xu要yao大da量liang的de算suan力li,尤you其qi是shi在zai學xue習xi和he推tui理li時shi。這zhe種zhong需xu求qiu不bu斷duan地di將jiang供gong電dian網wang絡luo的de邊bian界jie推tui向xiang前qian所suo未wei有you的de新xin水shui平ping。這zhe些xie高gao密mi度du工gong作zuo負fu載zai變bian得de愈yu加jia複fu雜za,更geng高gao的de瞬shun態tai需xu求qiu推tui動dong配pei電dian網wang絡luo的de每mei個ge部bu分fen都dou必bi須xu高gao效xiao運yun行xing。AI加速卡嚴格的功耗要求對係統性能也有影響。本文將討論AI加速卡的配電網絡要求,剖析瞬變的影響,並介紹ADI公司針對這些需求提出的多相供電解決方案。
簡介
AI技術完全改變了計算架構,以複現模仿人腦的神經網絡。AI看似已廣泛存在,但實際上,驅動AI的技術仍在發展。專門用於AI計算的處理器加速器IC包括GPU、現場可編程門陣列(FPGA)、TPU和其他類型的ASIC。本文將它們統稱為xPU。
隨著AI技術部署快速推進,數據中心將繼續批量購買AI加速卡。根據Gartner的報告,2021年AI芯片收入總計超過340億美元,預計到2026年將增長至860億美元。1xPU采用大規模並行計算方案,與普通CPU相比,在AI性能方麵實現了巨大飛躍。xPU擁有大量小內核,因此非常適合AI工作負載,有助於神經網絡訓練和AI推理。然而,xPU進行AI計算和移動數據通常會產生相對較大的功耗。簡而言之,xPU是非常耗電的IC。其嚴格的功耗要求對AI加速卡提出了新的挑戰,這也會影響係統性能。本文將分析AI加速卡的供電網絡要求,並介紹ADI公司針對這些嚴格要求提出的多相供電解決方案。
AI帶來的供電挑戰
AI涉及許多方麵,但能效不在其中。AI工作時,尤其是處理深度學習和推理等AI工作負載時,需要極高的計算功率。在係統層麵,AI加速器對於提供近乎即時的結果(正是這些結果使其有價值)發揮著關鍵作用。所有xPU都有多個高端內核,這些內核由數十億個晶體管構成,消耗數百安培電流。這些xPU的內核電壓(VCORE)已降至低於1.0 V的水平。圖1顯示了AI加速卡的通用框圖。本文將重點介紹為此類係統提出的多相控製器和相應的功率級IC。
圖1.通用AI加速卡框圖
AIjiasukasuoxudefengzhidianliumiduduiyurenhezhubanlaishuodoushifeichangchenzhongdefudan,nanyichuli。gongzuofuzaidegaodudongtaitexinghejigaodedianliushunbianhuidaozhifeichanggaodedi/dt和持續數微秒的尖峰電壓瞬變,這些瞬變非常具有破壞性,可能對xPU造成損害。AI的平均工作負載會持續很長時間,解耦電容將無法始終提供滿足即時需求的能量。本文的下一部分將介紹ADI公司提出的多相負載點(PoL)解決方案,它會消除典型AI加速器的瞬變,避免給整個配電網絡產生壓力。但首先,我們來討論AI帶來的電源設計挑戰。
AI帶來新的電源設計挑戰
目前,AI功率需求遠遠超過傳統供電網絡的能力。xPU穩壓器(VR)的要求與標準PoL穩壓器有很大不同。業界發現,某些應用要求在小於1 V的電壓下為xPU提供超過1000 A的電流。重要的是,電源必須非常穩定,產生的噪聲非常小,同時消除所有電壓瞬變可能性,以免導致xPU內部誤觸發。為了應對驚人的電流需求,高性能AI加速器VR PoL的設計必須滿足某些關鍵要求。
電壓尖峰和瞬變管理
AI加速卡的關鍵要求之一是VR的架構應能提供出色的瞬變電壓管理。向任何係統提供千瓦級功率始終是首要挑戰。輸出電壓(包括容差、紋波以及負載瞬態驟降和峰值)必須始終高於xPU最小電壓以避免係統掛起,並且還必須始終低於xPU最大電壓以免損壞xPU。加速卡的瞬態功率尖峰可能要求達到最大熱功率目標的2倍甚至更高。
這裏重要的是,PoLhuanludaikuanxuzugoulinghuo,yichulisuoyudaodegeleigengkuaisushunbian。daikuanyuegao,huanluxiangyingyuekuai,dianyapianchayuexiao。shixiankuaisushuntaidianyuanguijiaozhijiedeyizhongfangfashixuanzejuyoukuaisushuntaixingnengdewenyaqi。ADI AI VCORE係列IC具有非常低的頻率輸出噪聲、快速瞬態響應和高效率等特性。除此之外,ADI AI電源芯片組還支持負載線路,有助於電源設計人員有效管理AI工作負載引起的瞬變和尖峰。
長電源路徑走線中的I2R損耗和熱管理
隨著AI xPU處理器電流不斷提高,PoL供電解決方案的密度已成為關鍵要素。既要可靠地向xPU的de每mei個ge部bu分fen供gong電dian,同tong時shi不bu用yong擔dan心xin散san發fa的de熱re量liang會hui影ying響xiang芯xin片pian的de可ke靠kao性xing並bing導dao致zhi熱re失shi控kong,現xian在zai變bian得de極ji其qi困kun難nan。換huan言yan之zhi,熱re管guan理li是shi設she計ji這zhe種zhong高gao功gong率lv電dian源yuan所suo麵mian臨lin的de重zhong大da挑tiao戰zhan之zhi一yi。傳chuan統tong的de供gong電dian方fang法fa是shi將jiang穩wen壓ya器qi放fang置zhi在zaixPU的一側,以便將電力橫向傳輸到處理器。這些走線的電阻哪怕再小,也可能引起不可接受的電壓(I2R)下降。PCB電源層電阻上的壓降會隨著xPU電流提高而成比例地增加。這意味著VR和BGA引腳之間幾厘米的PCB電源走線會產生大量的損耗。PCB銅電源層中的此類損耗已成為計算穩壓器設計效率和性能的主導因素。傳統3芯片(分立式)供電解決方案需要大量高電流走線,與之相比,使用集成了電流和溫度電路模塊的單芯片功率級IC,可以大大減少PCB上的走線數量。
ADI價值主張:MAX16602 + MAX20790 + 耦合電感
AI穩壓器的精度變得更加嚴格。效率和尺寸是重中之重。性能和功耗也受到嚴格審查。正如上一節所述,解決AI加速卡VR設(she)計(ji)問(wen)題(ti)已(yi)成(cheng)為(wei)一(yi)項(xiang)艱(jian)巨(ju)的(de)任(ren)務(wu)。設(she)計(ji)人(ren)員(yuan)非(fei)常(chang)清(qing)楚(chu),若(ruo)不(bu)能(neng)有(you)效(xiao)處(chu)理(li)不(bu)必(bi)要(yao)的(de)瞬(shun)態(tai)效(xiao)應(ying),就(jiu)無(wu)法(fa)在(zai)所(suo)需(xu)電(dian)流(liu)中(zhong)產(chan)生(sheng)大(da)的(de)階(jie)躍(yue)。解(jie)決(jue)這(zhe)些(xie)瞬(shun)態(tai)效(xiao)應(ying)還(hai)需(xu)要(yao)某(mou)種(zhong)類(lei)型(xing)的(de)高(gao)精(jing)度(du)動(dong)態(tai)電(dian)壓(ya)定(ding)位(wei)或(huo)負(fu)載(zai)線(xian)路(lu)方(fang)案(an)。ADI公司大力投資AI市場,為48 V和12 V係統提供全套解決方案。本節介紹ADI AI多相電源芯片組,即MAX16602多相控製器和MAX20790功率級,以及我們獲得專利的耦合電感(CL)技術,以幫助解決這些AI PoL設計挑戰。圖2顯示了8相MAX16602CL8_EV設計的MAX16602、MAX20790和CL簡化框圖連接。這種相對簡潔的設計實現了每相約88 APKdegaodianliuchuanshunengli。neibubuchanghexianjindekongzhisuanfa,jiashanggonglvjizhongjichengdedianliujiancedianluyijiouhediangan,shiqichengweiyongyouchusexiaolvdexiaochicunjiejuefangan。
圖2.采用ADI高集成度電源芯片組的8相VR設計有助於實現高密度設計,同時減少外部連接
更高集成度的單芯片智能功率級IC
MAX20790是一款功能豐富的智能功率級IC,旨在與MAX16602(以及該產品係列中的其他幾款ADI控製器)配合使用,以實現高密度多相穩壓器。這是一種單芯片集成,幾乎消除了分立式設計中常見的FET和驅動器之間的寄生電阻和電感,從而實現高開關速度,而且功率損耗明顯低於傳統方案。如果檢測到開關節點(VX)故障,功率級會立即關閉,並將故障ID傳送給控製器。該智能功率級IC還有一個片內電流傳感器。此電流檢測電路模塊顯然優於使用電感直流電阻的方法。眾所周知,DCR檢測不準確,需要溫度補償才能使電流測量結果可信。
控製器IC
MAX16602是一款用於xPU VCORE VR的多相控製器。該IC提供高密度、靈活且可擴展的解決方案,可為AI xPU供電。該器件支持脈衝寬度調製(PWM)並聯,可控製多達16個相位。該IC的(de)架(jia)構(gou)簡(jian)化(hua)了(le)設(she)計(ji),減(jian)少(shao)了(le)組(zu)件(jian)數(shu)量(liang),支(zhi)持(chi)高(gao)級(ji)電(dian)源(yuan)管(guan)理(li)和(he)遙(yao)測(ce)功(gong)能(neng),並(bing)在(zai)整(zheng)個(ge)負(fu)載(zai)範(fan)圍(wei)內(nei)提(ti)高(gao)了(le)節(jie)能(neng)效(xiao)果(guo)。它(ta)實(shi)現(xian)了(le)自(zi)主(zhu)切(qie)相(xiang),在(zai)整(zheng)個(ge)負(fu)載(zai)範(fan)圍(wei)內(nei)保(bao)持(chi)高(gao)效(xiao)率(lv)。完(wan)整(zheng)芯(xin)片(pian)組(zu)是(shi)一(yi)個(ge)高(gao)效(xiao)率(lv)多(duo)相(xiang)降(jiang)壓(ya)轉(zhuan)換(huan)器(qi),具(ju)有(you)廣(guang)泛(fan)的(de)狀(zhuang)態(tai)和(he)參(can)數(shu)測(ce)量(liang)特(te)性(xing)。保(bao)護(hu)和(he)關(guan)斷(duan)參(can)數(shu)通(tong)過(guo)串(chuan)行(xing)PMBus®接口進行設置和監測,甚至包括功率級IC中收集的故障。
以下是該ADI控製器支持的其他幾個關鍵特性,這些特性對於任何AI供電方案都很重要。
高級調製方案
MAX16602利用高級調製方案(AMS)來提供更好的瞬態響應。該調製方案支持以極短的延遲開啟和關閉相位。根據負載需求,當負載增加時,可以同時開啟多個相位;當負載釋放時,可以立即關閉多個相位。啟用AMS後,係統閉環帶寬可以擴展,而不會造成相位裕量損失。因此,PoL能夠更好地響應AI VR的即時和動態電流需求。
負載線路控製
負載線路允許VCORE根據輸出電流在最小值和最大值之間變換。它實質上是為輕負載設置高VCORE值,為重負載設置低值。主要是為了讓控製環路可以處理更高的負載電流(這是讓計算順利進行所必需的)。ADI控製器在整個輸出電流範圍內提供準確的輸出負載線路控製。輸出電壓定位利用來自功率級IC的de無wu損sun電dian流liu檢jian測ce信xin號hao進jin行xing,這zhe些xie信xin號hao會hui反fan饋kui到dao控kong製zhi器qi。負fu載zai線xian路lu是shi在zai控kong製zhi器qi中zhong通tong過guo對dui電dian壓ya控kong製zhi環huan路lu誤wu差cha放fang大da器qi的de直zhi流liu增zeng益yi進jin行xing數shu字zi編bian程cheng來lai設she置zhi。控kong製zhi器qi的deEC表和數據手冊的表6中提供了各種直流負載線路特性,從0.105 mΩ到0.979 mΩ。圖3顯示了16相PoL設計在40 A至360 A負載階躍和800 A/μs擺率下的瞬態曲線。結果表明過衝極小。
總而言之,ADI的多相功率轉換和PoL產品提供高效率和高功率密度。圖5顯示了我們的16相MAX16602 + MAX20790 + CLH1110-4評估板的效率曲線以及偏置和電感損耗。ADI公司為各種AI加速器應用提供穩壓器和其他電源轉換解決方案。采用我們的多相控製器和集成功率級解決方案,有助於ADI客戶滿足嚴苛的動態xPU電源要求,應對當今AI應用帶來的設計挑戰。
圖3.16相VR在40 A至360 A階躍負載和800 A/μs擺率下的瞬態曲線
設計中添加有源電壓定位可以降低對負載瞬態響應的要求,並更好地利用xPU總容差窗口。負載線路控製有助於降低給定階躍負載的峰峰值輸出電壓偏差,同時可以減少輸出軌上的bulk電容量。總電壓波動將會減小,從而降低xPU崩潰或損壞的風險。請注意,MAX16602中的負載線路電路模塊可以禁用。
耦合電感(CL)的優勢
十多年來,ADI公司一直投資開發其專利CL技術。這項技術支持實現更高的密度、更大的帶寬、更快的瞬變解決方案,與分立式實現方案相比,效率提高50%,磁性元件尺寸縮小1.82倍。CL能夠有效地在穩態中用作大電感,在瞬態中用作小電感,除了減小電感尺寸外,還能節省COUT。2圖4顯示了ADI多相VR設計中常用的耦合電感係列。
圖4.ADI多相VR設計常用的耦合電感係列
根據設計規格和優先級,耦合電感消除電流紋波的優勢可用來換取更小的尺寸或更高的效率。1較大的係統優勢以及ADI產品的與眾不同之處在於,AI PoL設計人員可以使用CL相對輕鬆地實現VR總尺寸較小的解決方案。幾家知名磁性器件供應商擁有ADI的免費CL許可,可以為我們提供所需的元件。
頂部散熱封裝
頂部散熱為表麵貼裝封裝提供了另一種散熱途徑。MAX16602和MAX20790都是倒裝芯片四方扁平無引線(FCQFN)封裝,帶裸露的頂部散熱焊盤。FCQFN是shi一yi種zhong先xian進jin的de封feng裝zhuang,可ke提ti供gong設she計ji人ren員yuan青qing睞lai的de出chu色se熱re性xing能neng。這zhe種zhong無wu引yin線xian封feng裝zhuang不bu僅jin可ke以yi減jian少shao寄ji生sheng電dian感gan,還hai能neng從cong器qi件jian的de結jie直zhi接jie向xiang周zhou圍wei環huan境jing散san熱re。MAX20790的結殼頂部(θJC-TOP)熱阻為0.25°C/W。AI電源設計利用頂端散熱配置,可以提高係統的熱性能和設計靈活性。
圖5.16相AI VR評估板設計的效率曲線
垂直供電
隨著處理複雜AI功能的xPU問世,功耗隨之急劇增加。具有高達650 A連續電流和超過1000 A峰值電流傳輸能力的VR開始普及。為AI處理器供電的挑戰在於保持高效率。常規電源架構無法跟上這些非常耗電的AI xPU的步伐。VR芯片製造商和架構師正在從根本上研究不同的供電方法。業界正在討論一種為AI xPU供電的新趨勢,稱為垂直供電,也稱為背麵供電。
VR必須盡可能靠近負載輸入xPU電(dian)源(yuan)引(yin)腳(jiao),以(yi)實(shi)現(xian)高(gao)電(dian)流(liu)輸(shu)送(song)。我(wo)們(men)無(wu)法(fa)通(tong)過(guo)傳(chuan)統(tong)的(de)橫(heng)向(xiang)供(gong)電(dian)方(fang)法(fa)實(shi)現(xian)這(zhe)一(yi)目(mu)標(biao)。垂(chui)直(zhi)供(gong)電(dian)將(jiang)電(dian)源(yuan)調(tiao)節(jie)器(qi)移(yi)到(dao)處(chu)理(li)器(qi)正(zheng)下(xia)方(fang),從(cong)而(er)消(xiao)除(chu)了(le)PCB上可能產生的所有損耗。該結構將電源轉換器、功率級、電容和磁性元件放置在PCB的背麵,並通過過孔垂直地向xPU供電。換言之,電流傳輸是從xPU BGA陣列下方垂直進行。這是一條長度縮短的垂直路徑,可顯著降低阻抗並消除損耗。圖6顯示了安裝在PCB另一側、xPU下方的垂直供電模塊架構。此示意圖僅用於說明。ADI公司擁有廣泛的AI xPU VCORE解(jie)決(jue)方(fang)案(an)係(xi)列(lie),用(yong)於(yu)解(jie)決(jue)當(dang)今(jin)的(de)這(zhe)些(xie)問(wen)題(ti)。我(wo)們(men)的(de)電(dian)源(yuan)解(jie)決(jue)方(fang)案(an)能(neng)夠(gou)以(yi)非(fei)常(chang)小(xiao)的(de)外(wai)形(xing)尺(chi)寸(cun)實(shi)現(xian)出(chu)色(se)的(de)效(xiao)率(lv)。本(ben)文(wen)介(jie)紹(shao)的(de)解(jie)決(jue)方(fang)案(an)將(jiang)多(duo)相(xiang)控(kong)製(zhi)器(qi)MAX16602和智能單芯片功率級MAX20790相結合,可提供非常高的電源轉換效率、非常快的瞬態響應和非常準確的遙測報告。如需了解這些電源芯片組的更多信息或購買MAX16602CL8評估套件,請單擊此處。
參考文獻
1 “Forecast: AI Semiconductors, Worldwide, 2021-2027.” Gartner, April 2023.
1“預測:2021-2027全球AI半導體。”Gartner,2023年4月。
2 “Utilizing the Benefits of Coupled Inductors.” Analog Devices, Inc.
2“利用耦合電感的優勢。”ADI公司。
圖6.垂直供電模塊架構(僅用於說明目的)
構建垂直供電解決方案的難點包括解決模塊的重量和安裝問題。PCB另一側的xPU下方比較適合放置高頻解耦電容,用於儲存能量以滿足瞬時能量需求。垂直供電與ADI的CL技術相結合,可實現更高的電流密度、功率密度和更快的瞬態性能。垂直供電為ADI等PoL製造商提供了新的創新機會,並以自己的方式繼續支持摩爾定律的發展。
結語
支持機器學習和深度學習的加速卡通過提供加速訓練和推理工作負載所需的並行處理能力,將AI從理論變為現實。為高性能AI加速卡設計VR PoL是一項複雜的任務,尤其是在當前先進xPU的電源要求(表現在電流水平和電壓精度方麵)不斷提高的情況下。
本文表明,xPU VR的要求與標準PoL調節器有很大不同。xPU供電軌具有極快的負載變化,需要動態電壓定位或負載線路,並且必須很小。
關於ADI公司
Analog Devices, Inc. (NASDAQ: ADI)是全球領先的半導體公司,致力於在現實世界與數字世界之間架起橋梁,以實現智能邊緣領域的突破性創新。ADI提供結合模擬、數字和軟件技術的解決方案,推動數字化工廠、汽車和數字醫療等領域的持續發展,應對氣候變化挑戰,並建立人與世界萬物的可靠互聯。ADI公司2022財年收入超過120億美元,全球員工2.4萬餘人。攜手全球12.5萬家客戶,ADI助力創新者不斷超越一切可能。更多信息,請訪問www.analog.com/cn。
關於作者
Hamed M. Sanogo是ADI公司全球應用部門的雲和通信終端市場專家。Hamed擁有密歇根大學迪爾本分校的電子工程碩士學位,之後還獲得了達拉斯大學的工商管理碩士學位。在加入ADI公司之前,畢業後的Hamed曾在通用汽車擔任高級設計工程師,並在摩托羅拉係統擔任過高級電氣工程師以及Node B和RRH基帶卡設計師。在過去的17年裏,Hamed擔任過不同的職務,包括FAE/FAE經理、產品線經理,目前是通信和雲終端市場專家。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




