解密英偉達(dá)Tesla P100、GP100、DRIVE PX2平臺(tái)
在今年4月初開(kāi)幕的圖形處理器技術(shù)大會(huì)上,NVIDIA展示了針對(duì)VR虛擬現(xiàn)實(shí)和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個(gè)全新的計(jì)算模型”這樣的字眼。他指出,“消費(fèi)市場(chǎng)需要的計(jì)算機(jī)可再也不是那種馬馬虎虎就能打發(fā)的一般產(chǎn)品。大家都愿意享受超級(jí)計(jì)算速率帶來(lái)的快感,特別是基于GPU加速帶來(lái)的計(jì)算體驗(yàn)”。
當(dāng)然,超級(jí)計(jì)算時(shí)代的到來(lái)并非只是想想就能實(shí)現(xiàn)的,基于這樣的目標(biāo),NVIDIA在今年的GTC大會(huì)上推出了包括GPU芯片Tesla P100(基于全新Pascal平臺(tái)架構(gòu)上打造)、DRIVE PX2(用于自動(dòng)駕駛汽車(chē)的開(kāi)發(fā)平臺(tái))和用于深度學(xué)習(xí)研究的超級(jí)計(jì)算機(jī)DGX-1(使用Tesla P100芯片建造,運(yùn)算速度可達(dá)170萬(wàn)億次)在內(nèi)的一系列新技術(shù)和新產(chǎn)品。
基于NVIDIA全新計(jì)算平臺(tái)Pascal打造的Tesla P100 GPU芯片集成了NV Link總線,16GB HBM2顯存,內(nèi)建3584個(gè)CUDA,224個(gè)紋理單元,16GB HBM2顯存,帶寬可達(dá)到720GB/s,擁有基于16nm FinFET工藝打造的最大GPU核心。
△NVIDIA Tesla P100圖形處理器芯片
此外,Tesla P100芯片也是繼2014年發(fā)布,基于Kepler架構(gòu)平臺(tái)打造的Tesla K80之后,Tesla系列GPU產(chǎn)品的首次重大升級(jí)。
不過(guò)既然這是一款針對(duì)深度學(xué)習(xí)打造的GPU芯片,那么這里還必須要提一下Tesla P100芯片使用的NVIDIA旗艦GP100核心。GP100的性能一公布,給車(chē)云菌的感覺(jué)就是NVIDIA這次回歸了GK110大核心時(shí)代注重雙精度運(yùn)算的設(shè)計(jì),而且比之前更加變態(tài)。它每組SM單元中有64個(gè)FP32單元,但有32個(gè)FP64單元,F(xiàn)P64與FP32比例是1:2。這樣的設(shè)計(jì)意味著GP100的FP32 CUDA核心可以同時(shí)執(zhí)行2個(gè)FP16半精度運(yùn)算,因此FP16浮點(diǎn)性能高達(dá)21.6TFLOPS。
△NVIDIA GP100核心架構(gòu)示意圖
GPU并行運(yùn)算的特性很適合深度學(xué)習(xí)。據(jù)車(chē)云菌了解,NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學(xué)習(xí)超級(jí)計(jì)算機(jī),由8顆GP100核心及2顆16核Xeon E5處理器組成,深度計(jì)算性能達(dá)到了170TFLOPS,號(hào)稱比250臺(tái)X86服務(wù)器還要強(qiáng)大。
△NVIDIA 超級(jí)計(jì)算機(jī)DGX-1 售價(jià)高達(dá)$129000,真心不便宜
在過(guò)去的兩年里,每次GTC大會(huì)的主題演講環(huán)節(jié),黃仁勛都會(huì)將話題的重點(diǎn)放在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)研究上,并適時(shí)推出相關(guān)的新技術(shù)和新產(chǎn)品,而這些為NVIDIA之后進(jìn)行人工智能的研究奠定了基礎(chǔ)。今年也不例外。除了基于Pascal全新架構(gòu)平臺(tái)打造的Tesla P100芯片外,NVIDIA還發(fā)布了兩款Maxwell計(jì)算平臺(tái)下的全新GPU芯片—Tesla M40/M4,是為深度學(xué)習(xí)應(yīng)用而特別打造的。