下一代尖端AI係統的電源解決方案
發布時間:2021-09-02 來源:Yat Tam 責任編輯:wenwei
【導讀】人工智能(AI)綜合了多種解決問題的方法,例如數學、計算統計、機器學習和預測分析。AI係統通過基於計算機的“神經”網絡來模仿人腦學習並解決問題。這種神經網絡由並行處理器組成,能夠運行複雜的學習任務並執行軟件算法。如今的AI還在改革計算架構,以複製模仿人腦的神經網絡。盡管在具有傳統中央處理器(CPU)的服務器上也可以訓練或開發通用模型,但大多數神經網絡都需要自定義的內置硬件來進行訓練。
圖形處理單元(GPU)和張量處理單元(TPU)是用於加速神經網絡訓練的常見加速器。它們可以處理重複性和密集型計算,但卻異常耗電。例如,早期的AI市場主導者英偉達的DGX-1 GPU超級計算機內置8個Tesla P100 GPU,每個GPU算力達到21.2 TeraFLOP,總共需要3200W的係統總功率。最新一代的DGX-2超級計算機則內置16個Tesla V100 GPU,每個GPU算力達2 petaFLOP,所需係統總功率達到10kW。因此,AI市場將迅速增長以滿足不斷增長的電源需求也就不足為奇了。
電源設計挑戰
AI電(dian)源(yuan)係(xi)統(tong)設(she)計(ji)人(ren)員(yuan)麵(mian)臨(lin)多(duo)方(fang)麵(mian)的(de)挑(tiao)戰(zhan)。提(ti)供(gong)千(qian)瓦(wa)功(gong)率(lv)是(shi)他(ta)們(men)的(de)第(di)一(yi)個(ge)挑(tiao)戰(zhan),而(er)且(qie)效(xiao)率(lv)絕(jue)對(dui)至(zhi)關(guan)重(zhong)要(yao)。要(yao)知(zhi)道(dao),這(zhe)些(xie)計(ji)算(suan)係(xi)統(tong)是(shi)以(yi)全(quan)功(gong)率(lv)運(yun)行(xing)的(de)複(fu)雜(za)負(fu)載(zai)。活(huo)躍(yue)度(du)下(xia)降(jiang),功(gong)率(lv)需(xu)求(qiu)也(ye)會(hui)隨(sui)之(zhi)下(xia)降(jiang)。係(xi)統(tong)必(bi)須(xu)在(zai)整(zheng)個(ge)電(dian)力(li)需(xu)求(qiu)中(zhong)保(bao)持(chi)盡(jin)可(ke)能(neng)高(gao)的(de)效(xiao)率(lv)。浪(lang)費(fei)的(de)每(mei)一(yi)瓦(wa)能(neng)量(liang)都(dou)會(hui)作(zuo)為(wei)熱(re)量(liang)消(xiao)散(san),並(bing)轉(zhuan)化(hua)為(wei)數(shu)據(ju)中(zhong)心(xin)對(dui)散(san)熱(re)係(xi)統(tong)的(de)更(geng)高(gao)要(yao)求(qiu),這(zhe)會(hui)增(zeng)加(jia)運(yun)營(ying)成(cheng)本(ben)以(yi)及(ji)碳(tan)足(zu)跡(ji)。
kongjianchengbenyezaibuduanshangsheng。xiandaishujuzhongxindoubaohanchengbaishangqiangechulidanyuan,yincishebeidaxiaofeichangzhongyao。jianxiaodangedanyuandechicun,jiukeyizaiyudaxingjiejuefanganxiangtongdekongjianzhongyingyonggengduoshebei,congershixiangenggaodechulinenglimidu。raner,yuexiaodechicunyueyaoqiujidaditigaogonglvmidu,bingjianxiaosanremianji。zheshidesanreguanlichengweixiayidaijianduanCPU、GPU和TPU電源設計麵臨的重大挑戰之一。
另ling外wai,係xi統tong複fu雜za性xing的de增zeng加jia和he設she計ji周zhou期qi的de壓ya縮suo使shi設she計ji資zi源yuan更geng加jia緊jin張zhang。資zi源yuan大da部bu分fen被bei分fen配pei給gei係xi統tong關guan鍵jian知zhi識shi產chan權quan的de開kai發fa,這zhe意yi味wei著zhe電dian源yuan方fang案an相xiang關guan的de電dian路lu常chang常chang被bei忽hu略lve,直zhi到dao開kai發fa周zhou期qi的de後hou期qi。實shi際ji上shang,我wo們men隻zhi需xu很hen少shao的de時shi間jian,並bing且qie可ke能neng隻zhi需xu很hen少shao的de電dian源yuan設she計ji資zi源yuan就jiu可ke以yi解jie決jue上shang述shu的de挑tiao戰zhan,得de到dao理li想xiang的de整zheng體ti電dian源yuan解jie決jue方fang案an,它ta將jiang是shi節jie省sheng空kong間jian的de、高效的、可擴展的、靈活的,並且隻需要最少的設計工作。
數字控製與模擬控製解決方案
模擬控製解決方案現在已無法應對AI市場中快速增長的電源需求。現在的電源係統更加智能,它被集成到整體解決方案中,與主CPU/GPU/TPU之間的通信也成為一項設計要求。在為AI市場設計高端電源解決方案時,數字控製解決方案將占據主導。
理想的控製解決方案應當兼容多種產品(例如Intel、AMD、PMBus),並且因可擴展且配置靈活而易於使用。包括MPS在內的很多公司都提供了這類理想的高級控製器(參見表1)。它們提供了廣泛而準確的係統控製,同時提供詳細而精確的監測。電壓、電流、頻(pin)率(lv)和(he)故(gu)障(zhang)監(jian)測(ce)均(jun)可(ke)在(zai)寬(kuan)範(fan)圍(wei)內(nei)進(jin)行(xing)配(pei)置(zhi)。工(gong)程(cheng)師(shi)可(ke)以(yi)實(shi)時(shi)訪(fang)問(wen)這(zhe)些(xie)監(jian)測(ce)值(zhi),以(yi)全(quan)麵(mian)了(le)解(jie)解(jie)決(jue)方(fang)案(an)的(de)性(xing)能(neng)。有(you)經(jing)驗(yan)的(de)工(gong)程(cheng)師(shi)還(hai)可(ke)以(yi)通(tong)過(guo)預(yu)測(ce)分(fen)析(xi)來(lai)優(you)化(hua)運(yun)行(xing)時(shi)間(jian),並(bing)在(zai)需(xu)要(yao)維(wei)修(xiu)時(shi)獲(huo)取(qu)更(geng)多(duo)可(ke)用(yong)數(shu)據(ju),從(cong)而(er)最(zui)大(da)程(cheng)度(du)地(di)縮(suo)短(duan)停(ting)機(ji)時(shi)間(jian)。

表1:高級控製器vs.模擬和數字控製解決方案
功率級:集成是關鍵
顯而易見,電源解決方案沒有功率級就無法工作,而功率級通常會采用分立式解決方案。 分立式解決方案由驅動器IC和一對外部MOSFET組成,為三芯片解決方案。還有一種方法是將多芯片驅動器-MOSFET(DrMOS)共同封裝到一個IC解(jie)決(jue)方(fang)案(an)中(zhong)。如(ru)前(qian)所(suo)述(shu),不(bu)斷(duan)縮(suo)小(xiao)的(de)係(xi)統(tong)板(ban)麵(mian)積(ji)使(shi)三(san)芯(xin)片(pian)解(jie)決(jue)方(fang)案(an)變(bian)得(de)不(bu)再(zai)理(li)想(xiang),因(yin)為(wei)它(ta)增(zeng)加(jia)了(le)有(you)限(xian)板(ban)空(kong)間(jian)中(zhong)的(de)組(zu)件(jian)數(shu)量(liang)。共(gong)同(tong)封(feng)裝(zhuang)的(de)多(duo)芯(xin)片(pian)解(jie)決(jue)方(fang)案(an)體(ti)積(ji)更(geng)小(xiao),所(suo)需(xu)的(de)組(zu)件(jian)也(ye)更(geng)少(shao);不過,其封裝內部的寄生電感仍然很高,這會導致效率的損失,對AI等大功率應用而言也不理想。

圖1:功率級的常用實現方法
與傳統的分立式和多芯片解決方案不同,MPS提供了一種單片功率級解決方案。其功率級具有低靜態電流、同步降壓柵極驅動器以及單個芯片上的一對上管和下管MOSFET。通過將所有關鍵元件集成在一個封裝中,可以輕鬆控製驅動器/MOSFET,並最大程度地減少開關節點處的振鈴。另外,封裝和板級之間的寄生電感也被大大降低。這種設計可以實現最先進的CPU/GPU/TPU設計所需的低輸出電壓下更高的效率。
單片功率級隻需最少數量的外部組件,因此簡化了原理圖以及PCB布局。其基本設計可以分兩步完成:
1. 選擇適當數量的輸入和輸出電容器以滿足電壓和電流紋波要求;
2. 選擇一個電感器以滿足總負載電流需求。

圖2:傳統解決方案與高級解決方案的比較
這種器件的典型功率級可在各種溫度下的全負載範圍內實現出色的電流檢測精度(±2%) ,並以高達3MHz的開關頻率工作(見圖2)。在極其寶貴的空間內還可以同時提供各種可配置的故障保護功能,如過流保護(OCP)、相位故障檢測和IC溫度報告,為設計人員提供了一種小而強大的解決方案,還不會影響效率或瞬態響應。
結論
當今的AI係統都是通過多個高性能計算機係統來實現的,它在很多方麵都對電源設計人員提出了挑戰。傳統的數據中心設計正迅速從通用的僅CPU解決方案演化為CPU、GPU和TPU的組合方案,這對電源設計解決方案提出了新的、更嚴格的要求。數字控製器及其功率級解決方案帶來了靈活性和適應性,以及精確的控製、遙測和保護功能。 它使電源設計人員能夠創建具有高效率和高功率密度的最新電源解決方案,可以滿足快速增長的AI市場當前與未來的高功率需求。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
微波功率管
微波開關
微波連接器
微波器件
微波三極管
微波振蕩器
微電機
微調電容
微動開關
微蜂窩
位置傳感器
溫度保險絲
溫度傳感器
溫控開關
溫控可控矽
聞泰
穩壓電源
穩壓二極管
穩壓管
無焊端子
無線充電
無線監控
無源濾波器
五金工具
物聯網
顯示模塊
顯微鏡結構
線圈
線繞電位器
線繞電阻


