詳解FPGA如何實現FP16格式點積級聯運算
發布時間:2020-08-13 責任編輯:lina
【導讀】通過使用Achronix Speedster7t FPGA中的機器學習加速器MLP72,開發人員可以輕鬆選擇浮點/定點格式和多種位寬,或快速應用塊浮點,並通過內部級聯可以達到理想性能。
通過使用Achronix Speedster7t FPGA中的機器學習加速器MLP72,開發人員可以輕鬆選擇浮點/定點格式和多種位寬,或快速應用塊浮點,並通過內部級聯可以達到理想性能。
shenjingwangluojiagouzhongdehexinzhiyijiushijuanjiceng,juanjidezuijibencaozuojiushidianji。xiangliangchengfadejieguoshixiangliangdemeigeyuansudezonghexiangchengzaiyiqi,tongchangchengzhiweidianji。cixiangliangchengfaruxiasuoshi:

圖1點積操作
該總和S由每個矢量元素的總和相乘而成,因此
本文講述的是使用FP16格式的點積運算實例,展示了MLP72支持的數字類型和乘數的範圍。
此設計實現了同時處理8對FP16輸入的點積。該設計包含四個MLP72,使用MLP內部的級聯路徑連接。每個MLP72將兩個並行乘法的結果相加
,每個乘法都是i_a輸入乘以i_b輸入(均為FP16格式)的結果。來自每個MLP72的總和沿著MLP72的列級聯到上麵的下一個MLP72塊。在最後一個MLP72中,在每個周期上,計算八個並行FP16乘法的總和。
最終結果是多個輸入周期內的累加總和,其中累加由i_first和i_last輸入控製。i_first輸入信號指示累加和歸零的第一組輸入。i_last信號指示要累加和加到累加的最後一組輸入。最終的i_last值可在之後的六個周期使用,並使用i_last o_valid進行限定。兩次運算之間可以無空拍。
配置說明

表1 FP16點積配置表
端口說明

表2 FP16點積端口說明表
時序圖

圖2 FP16點積時序圖
其中,

那麼,以上運算功能如何對應到MLP內部呢?其後的細節已分為MLP72中的多個功能階段進行說明。
進位鏈
首先請看下圖,MLP之間的進位鏈結構,這是MLP內部的專用走線,可以保證級聯的高效執行。

圖3 MLP進位鏈
乘法階段
下圖是MLP中浮點乘法功能階段,其中寄存器代表一級可選延遲。

圖4 MLP乘法功能階段框圖
MLP72浮點乘法級包括兩個24位全浮點乘法器和一個24位全浮點加法器。兩個乘法器執行A×B和C×D的並行計算。加法器將兩個結果相加得到A×B + C×D。
乘法階段有兩個輸出。下半部分輸出可以在A×B或(A×B + C×D)之間選擇。上半部分輸出始終為C×D。
乘法器和加法器使用的數字格式由字節選擇參數以及和參數設置的格式確定。
浮點輸出具有與整數輸出級相同的路徑和結構。MLP72可以配置為在特定階段選擇整數或等效浮點輸入。輸出支持兩個24位全浮點加法器,可以對其進行加法或累加配置。進一步可以加載加法器(開始累加),可以將其設置為減法,並支持可選的舍入模式。
最終輸出階段支持將浮點輸出格式化為MLP72支持的三種浮點格式中的任何一種。此功能使MLP72可以外部支持大小一致的浮點輸入和輸出(例如fp16或bfloat16),而在內部以fp24執行所有計算。

圖5 MLP浮點輸出階段框圖
需要強調的是本設計輸入和輸出都是FP16格式,中間計算過程,即進位鏈上的fwdo_out和fwdi_dout 都是FP24格式。具體邏輯框圖如下所示:

圖6 FP16點積邏輯框圖
MLP內部數據流示意圖:

圖7 FP16點積在MLP內部數據流圖
最終ACE的時序結果如下:

(來源:Achronix,作者:楊宇,Achronix資深現場應用工程師)
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請電話或者郵箱聯係小編進行侵刪。
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
微波功率管
微波開關
微波連接器
微波器件
微波三極管
微波振蕩器
微電機
微調電容
微動開關
微蜂窩
位置傳感器
溫度保險絲
溫度傳感器
溫控開關
溫控可控矽
聞泰
穩壓電源
穩壓二極管
穩壓管
無焊端子
無線充電
無線監控
無源濾波器
五金工具
物聯網
顯示模塊
顯微鏡結構
線圈
線繞電位器
線繞電阻



