下一代尖端AI係統的電源解決方案-電源管理-電子元件技術網

你的位置：首頁 > 電源管理 > 正文

下一代尖端AI係統的電源解決方案

發布時間：2021-09-02 來源：Yat Tam 責任編輯：wenwei

【導讀】人工智能（AI）綜合了多種解決問題的方法，例如數學、計算統計、機器學習和預測分析。AI係統通過基於計算機的“神經”網絡來模仿人腦學習並解決問題。這種神經網絡由並行處理器組成，能夠運行複雜的學習任務並執行軟件算法。如今的AI還在改革計算架構，以複製模仿人腦的神經網絡。盡管在具有傳統中央處理器（CPU）的服務器上也可以訓練或開發通用模型，但大多數神經網絡都需要自定義的內置硬件來進行訓練。

圖形處理單元（GPU）和張量處理單元（TPU）是用於加速神經網絡訓練的常見加速器。它們可以處理重複性和密集型計算，但卻異常耗電。例如，早期的AI市場主導者英偉達的DGX-1 GPU超級計算機內置8個Tesla P100 GPU，每個GPU算力達到21.2 TeraFLOP，總共需要3200W的係統總功率。最新一代的DGX-2超級計算機則內置16個Tesla V100 GPU，每個GPU算力達2 petaFLOP，所需係統總功率達到10kW。因此，AI市場將迅速增長以滿足不斷增長的電源需求也就不足為奇了。

電源設計挑戰

AI電(dian)源(yuan)係(xi)統(tong)設(she)計(ji)人(ren)員(yuan)麵(mian)臨(lin)多(duo)方(fang)麵(mian)的(de)挑(tiao)戰(zhan)。提(ti)供(gong)千(qian)瓦(wa)功(gong)率(lv)是(shi)他(ta)們(men)的(de)第(di)一(yi)個(ge)挑(tiao)戰(zhan)，而(er)且(qie)效(xiao)率(lv)絕(jue)對(dui)至(zhi)關(guan)重(zhong)要(yao)。要(yao)知(zhi)道(dao)，這(zhe)些(xie)計(ji)算(suan)係(xi)統(tong)是(shi)以(yi)全(quan)功(gong)率(lv)運(yun)行(xing)的(de)複(fu)雜(za)負(fu)載(zai)。活(huo)躍(yue)度(du)下(xia)降(jiang)，功(gong)率(lv)需(xu)求(qiu)也(ye)會(hui)隨(sui)之(zhi)下(xia)降(jiang)。係(xi)統(tong)必(bi)須(xu)在(zai)整(zheng)個(ge)電(dian)力(li)需(xu)求(qiu)中(zhong)保(bao)持(chi)盡(jin)可(ke)能(neng)高(gao)的(de)效(xiao)率(lv)。浪(lang)費(fei)的(de)每(mei)一(yi)瓦(wa)能(neng)量(liang)都(dou)會(hui)作(zuo)為(wei)熱(re)量(liang)消(xiao)散(san)，並(bing)轉(zhuan)化(hua)為(wei)數(shu)據(ju)中(zhong)心(xin)對(dui)散(san)熱(re)係(xi)統(tong)的(de)更(geng)高(gao)要(yao)求(qiu)，這(zhe)會(hui)增(zeng)加(jia)運(yun)營(ying)成(cheng)本(ben)以(yi)及(ji)碳(tan)足(zu)跡(ji)。

kongjianchengbenyezaibuduanshangsheng。xiandaishujuzhongxindoubaohanchengbaishangqiangechulidanyuan，yincishebeidaxiaofeichangzhongyao。jianxiaodangedanyuandechicun，jiukeyizaiyudaxingjiejuefanganxiangtongdekongjianzhongyingyonggengduoshebei，congershixiangenggaodechulinenglimidu。raner，yuexiaodechicunyueyaoqiujidaditigaogonglvmidu，bingjianxiaosanremianji。zheshidesanreguanlichengweixiayidaijianduanCPU、GPU和TPU電源設計麵臨的重大挑戰之一。

另ling外wai，係xi統tong複fu雜za性xing的de增zeng加jia和he設she計ji周zhou期qi的de壓ya縮suo使shi設she計ji資zi源yuan更geng加jia緊jin張zhang。資zi源yuan大da部bu分fen被bei分fen配pei給gei係xi統tong關guan鍵jian知zhi識shi產chan權quan的de開kai發fa，這zhe意yi味wei著zhe電dian源yuan方fang案an相xiang關guan的de電dian路lu常chang常chang被bei忽hu略lve，直zhi到dao開kai發fa周zhou期qi的de後hou期qi。實shi際ji上shang，我wo們men隻zhi需xu很hen少shao的de時shi間jian，並bing且qie可ke能neng隻zhi需xu很hen少shao的de電dian源yuan設she計ji資zi源yuan就jiu可ke以yi解jie決jue上shang述shu的de挑tiao戰zhan，得de到dao理li想xiang的de整zheng體ti電dian源yuan解jie決jue方fang案an，它ta將jiang是shi節jie省sheng空kong間jian的de、高效的、可擴展的、靈活的，並且隻需要最少的設計工作。

數字控製與模擬控製解決方案

模擬控製解決方案現在已無法應對AI市場中快速增長的電源需求。現在的電源係統更加智能，它被集成到整體解決方案中，與主CPU/GPU/TPU之間的通信也成為一項設計要求。在為AI市場設計高端電源解決方案時，數字控製解決方案將占據主導。

理想的控製解決方案應當兼容多種產品（例如Intel、AMD、PMBus），並且因可擴展且配置靈活而易於使用。包括MPS在內的很多公司都提供了這類理想的高級控製器（參見表1）。它們提供了廣泛而準確的係統控製，同時提供詳細而精確的監測。電壓、電流、頻(pin)率(lv)和(he)故(gu)障(zhang)監(jian)測(ce)均(jun)可(ke)在(zai)寬(kuan)範(fan)圍(wei)內(nei)進(jin)行(xing)配(pei)置(zhi)。工(gong)程(cheng)師(shi)可(ke)以(yi)實(shi)時(shi)訪(fang)問(wen)這(zhe)些(xie)監(jian)測(ce)值(zhi)，以(yi)全(quan)麵(mian)了(le)解(jie)解(jie)決(jue)方(fang)案(an)的(de)性(xing)能(neng)。有(you)經(jing)驗(yan)的(de)工(gong)程(cheng)師(shi)還(hai)可(ke)以(yi)通(tong)過(guo)預(yu)測(ce)分(fen)析(xi)來(lai)優(you)化(hua)運(yun)行(xing)時(shi)間(jian)，並(bing)在(zai)需(xu)要(yao)維(wei)修(xiu)時(shi)獲(huo)取(qu)更(geng)多(duo)可(ke)用(yong)數(shu)據(ju)，從(cong)而(er)最(zui)大(da)程(cheng)度(du)地(di)縮(suo)短(duan)停(ting)機(ji)時(shi)間(jian)。

下一代尖端AI係統的電源解決方案

表1：高級控製器vs.模擬和數字控製解決方案

功率級：集成是關鍵

顯而易見，電源解決方案沒有功率級就無法工作，而功率級通常會采用分立式解決方案。分立式解決方案由驅動器IC和一對外部MOSFET組成，為三芯片解決方案。還有一種方法是將多芯片驅動器-MOSFET（DrMOS）共同封裝到一個IC解(jie)決(jue)方(fang)案(an)中(zhong)。如(ru)前(qian)所(suo)述(shu)，不(bu)斷(duan)縮(suo)小(xiao)的(de)係(xi)統(tong)板(ban)麵(mian)積(ji)使(shi)三(san)芯(xin)片(pian)解(jie)決(jue)方(fang)案(an)變(bian)得(de)不(bu)再(zai)理(li)想(xiang)，因(yin)為(wei)它(ta)增(zeng)加(jia)了(le)有(you)限(xian)板(ban)空(kong)間(jian)中(zhong)的(de)組(zu)件(jian)數(shu)量(liang)。共(gong)同(tong)封(feng)裝(zhuang)的(de)多(duo)芯(xin)片(pian)解(jie)決(jue)方(fang)案(an)體(ti)積(ji)更(geng)小(xiao)，所(suo)需(xu)的(de)組(zu)件(jian)也(ye)更(geng)少(shao)；不過，其封裝內部的寄生電感仍然很高，這會導致效率的損失，對AI等大功率應用而言也不理想。

下一代尖端AI係統的電源解決方案

圖1：功率級的常用實現方法

與傳統的分立式和多芯片解決方案不同，MPS提供了一種單片功率級解決方案。其功率級具有低靜態電流、同步降壓柵極驅動器以及單個芯片上的一對上管和下管MOSFET。通過將所有關鍵元件集成在一個封裝中，可以輕鬆控製驅動器/MOSFET，並最大程度地減少開關節點處的振鈴。另外，封裝和板級之間的寄生電感也被大大降低。這種設計可以實現最先進的CPU/GPU/TPU設計所需的低輸出電壓下更高的效率。

單片功率級隻需最少數量的外部組件，因此簡化了原理圖以及PCB布局。其基本設計可以分兩步完成：

1. 選擇適當數量的輸入和輸出電容器以滿足電壓和電流紋波要求；

2. 選擇一個電感器以滿足總負載電流需求。

下一代尖端AI係統的電源解決方案

圖2：傳統解決方案與高級解決方案的比較

這種器件的典型功率級可在各種溫度下的全負載範圍內實現出色的電流檢測精度(±2%) ，並以高達3MHz的開關頻率工作（見圖2）。在極其寶貴的空間內還可以同時提供各種可配置的故障保護功能，如過流保護（OCP）、相位故障檢測和IC溫度報告，為設計人員提供了一種小而強大的解決方案，還不會影響效率或瞬態響應。

結論

當今的AI係統都是通過多個高性能計算機係統來實現的，它在很多方麵都對電源設計人員提出了挑戰。傳統的數據中心設計正迅速從通用的僅CPU解決方案演化為CPU、GPU和TPU的組合方案，這對電源設計解決方案提出了新的、更嚴格的要求。數字控製器及其功率級解決方案帶來了靈活性和適應性，以及精確的控製、遙測和保護功能。它使電源設計人員能夠創建具有高效率和高功率密度的最新電源解決方案，可以滿足快速增長的AI市場當前與未來的高功率需求。

免責聲明：本文為轉載文章，轉載此文目的在於傳遞更多信息，版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題，請聯係小編進行處理。

推薦閱讀：

智能電機的 PMSM 參數識別

為什麼使用DC-DC轉換器應盡可能靠近負載的負載點電源？

使用增強模式NMOS晶體管的簡單差分放大器

七步設計反激式變換器

用於高壓電池組的新型電量計解決方案

上一篇：智能電機的 PMSM 參數識別

下一篇：適用於 36V 電池的高效隔離

特別推薦

技術文章更多>>

技術白皮書下載更多>>

熱門搜索

友情鏈接(QQ：317243736)

我愛方案網 ICGOO元器件商城創芯在線檢測芯片查詢天天IC網電子產品世界無線通信模塊控製工程網電子開發網電子技術應用與非網世紀電源網 21ic電子技術資料下載電源網電子發燒友網中電網中國工業電器網連接器礦山設備網工博士智慧農業工業路由器天工網乾坤芯電子元器件采購網亞馬遜KOL 聚合物鋰電池工業自動化設備企業查詢工業路由器元器件商城連接器 USB中文網今日招標網塑料機械網農業機械中國IT產經新聞網高低溫試驗箱

關閉

關閉