瞄準異構計算前景,加速云推出全球首張Stratix10加速卡
“我們是一家純技術推導出來的公司。”加速云CEO鄔鋼在此次發(fā)布會上多次強調這一點。而一家技術推導出來的公司都有什么特點呢?從鄔剛的分享中可以看出來,加速云非常清楚自己要做什么,而且毫不張揚,腳踏實地。在近日北京召開的新品發(fā)布會上,加速云一舉發(fā)布了多款硬件產(chǎn)品和IP。讓我們一起來了解一下。
瞄準異構計算前景
“2014年按照英特爾的發(fā)展,下一步一定是異構計算。”鄔剛分享到,“英特爾早先曾在工業(yè)領域推出過X86+FPGA的方案,但是并沒有推開。”鄔剛早就洞察到,英特爾將會在異構計算方面投入更多,而我們都知道FPGA的門檻較高,因此生態(tài)的建設尤為重要。尤其是在很多應用領域的工程師,并不十分清楚FPGA需要如何進行開發(fā)。在2015年的IDF大會上,英特爾宣布將推出一款X86+FPGA的處理器,這時候鄔剛認為時機到了,因此開始全力著手進行這方面的開發(fā)。
如果你僅從名字上來判斷,可能會覺得這是一家專門搞云服務的公司。其實不然,加速云應該說是一家擁有很多IP的硬件公司。鄔剛先生表示,在國內(nèi)這種環(huán)境下,單純做IP并不容易,需要與硬件進行綁定。在加速云的團隊里面,既要有很強的算法能力,又要有非常強的工程化的能力。這也是加速云與其它公司相比比較特殊的一點。
在此次發(fā)布會上,加速云是首次面向媒體發(fā)聲,一舉推出了兩大系列的硬件加速產(chǎn)品(SC-OPS,SC-VPX),兩個IP庫(FDNN,FBLAS)和三大解決方案(深度學習解決方案、高性能計算及數(shù)字信號處理解決方案、邊緣計算解決方案),下面筆者來給大家簡單介紹一番。
全球首張Stratix10加速卡和VPX刀片加速平臺
SC-OPS是加速云推出的一款FPGA加速卡,同時這也是世界上第一款使用了14nm工藝Stratix10的加速卡。據(jù)鄔剛介紹,加速云屬于英特爾TOP 10的支持客戶之一,因此可以在Stratix10剛流片時候就可以拿到芯片開始進行設計,這也是其競爭力之一。
SC-OPS集成2753K LE資源和9.2T FLOPS單精度浮點計算能力。單板支持2個40G光口或者電口,支持板間通訊以及設備間級聯(lián);板載8個DDR4通道, 支持高帶寬和大容量的存儲訪問。
VPX加速系統(tǒng)是一個定制的專用系統(tǒng)。VPX是一個標準,在整個系統(tǒng)中有主控和業(yè)務卡。主控主要用來做配置管理和通信用,業(yè)務卡來做數(shù)據(jù)處理。VPX主要定位于數(shù)字信號處理和高性能計算領域。據(jù)鄔剛介紹,這一張卡最多可以有兩個Stratix10,有可以插5張卡的和插10張卡的機框;加速云曾經(jīng)做過一臺可以插16張OPS卡的超算去換天河,比例非常可觀。
據(jù)悉,VPX單板支持24個200維雙精度線性方程求解,相當于360臺至強服務器,一個6U整機相當于3600臺至強服務器。
深度學習加速庫FDNN和高性能計算加速庫FBLAS
"硬件是載體,IP才是核心。FPGA是一張白紙,有了IP,你可以把它畫成清明上河圖或者其它。“鄔剛如是來形容IP的重要性。
深度學習加速庫FDNN是國內(nèi)首個支持通用卷積神經(jīng)網(wǎng)絡的FPGA加速庫,基于RTL級代碼,可以提供很高的性能和靈活配置特性。如果把FDNN單獨開片的話可以看作是一個類似于谷歌TPU的東西。高性能計算加速庫FBLAS是業(yè)界更高性能的RTL級數(shù)學加速庫。
據(jù)鄔剛介紹,F(xiàn)PGA原廠對于特定行業(yè)的理解并沒有那么深刻,而特定行業(yè)的開發(fā)者對于FPGA的應用也有一定困難。對于半導體廠商來講,也不是每個行業(yè)都很懂,也不可能投入那么多的工程師。比如專門設置一個團隊搞深度學習,這個不現(xiàn)實。因此原廠更希望提供一些基礎的東西,然后找一個第三方來幫他們把行業(yè)內(nèi)的IP都做好,加速云就是它的第三方。加速云做的IP比普通的IP層次還要高一些,普通的IP比如做一個DDS,做一個接口,做一個協(xié)議。加速云的IP是基于行業(yè)特點開發(fā)而來,可以讓大家在FPGA的開發(fā)上更加易用。
在異構計算領域,加速云走的很快,而且腳踏實地。異構計算的前景已經(jīng)得到了業(yè)界的普遍認可,目前加速云已經(jīng)積累了很多專用的IP,如果有來者想要趕超,必要要搭上時間再開發(fā)一遍。鄔剛表示:“想干這件事,先花兩年把IP做出來再說,我都已經(jīng)花了兩年做完了,這就是門檻。”