解密英偉達(dá)Tesla P100、GP100、DRIVE PX2平臺(tái)

時(shí)間：2020-08-26 09:24:01

關(guān)鍵字：人工智能汽車(chē)電子英偉達(dá)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　在今年4月初開(kāi)幕的圖形處理器技術(shù)大會(huì)上，NVIDIA展示了針對(duì)VR虛擬現(xiàn)實(shí)和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個(gè)全新的計(jì)算模型&rd

　　在今年4月初開(kāi)幕的圖形處理器技術(shù)大會(huì)上，NVIDIA展示了針對(duì)VR虛擬現(xiàn)實(shí)和深度學(xué)習(xí)應(yīng)用的最新技術(shù)和產(chǎn)品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復(fù)重申“一個(gè)全新的計(jì)算模型”這樣的字眼。他指出，“消費(fèi)市場(chǎng)需要的計(jì)算機(jī)可再也不是那種馬馬虎虎就能打發(fā)的一般產(chǎn)品。大家都愿意享受超級(jí)計(jì)算速率帶來(lái)的快感，特別是基于GPU加速帶來(lái)的計(jì)算體驗(yàn)”。

　　當(dāng)然，超級(jí)計(jì)算時(shí)代的到來(lái)并非只是想想就能實(shí)現(xiàn)的，基于這樣的目標(biāo)，NVIDIA在今年的GTC大會(huì)上推出了包括GPU芯片Tesla P100（基于全新Pascal平臺(tái)架構(gòu)上打造）、DRIVE PX2（用于自動(dòng)駕駛汽車(chē)的開(kāi)發(fā)平臺(tái)）和用于深度學(xué)習(xí)研究的超級(jí)計(jì)算機(jī)DGX-1（使用Tesla P100芯片建造，運(yùn)算速度可達(dá)170萬(wàn)億次）在內(nèi)的一系列新技術(shù)和新產(chǎn)品。

　　基于NVIDIA全新計(jì)算平臺(tái)Pascal打造的Tesla P100 GPU芯片集成了NV Link總線，16GB HBM2顯存，內(nèi)建3584個(gè)CUDA，224個(gè)紋理單元，16GB HBM2顯存，帶寬可達(dá)到720GB/s，擁有基于16nm FinFET工藝打造的最大GPU核心。

　　△NVIDIA Tesla P100圖形處理器芯片

　　此外，Tesla P100芯片也是繼2014年發(fā)布，基于Kepler架構(gòu)平臺(tái)打造的Tesla K80之后，Tesla系列GPU產(chǎn)品的首次重大升級(jí)。

　　不過(guò)既然這是一款針對(duì)深度學(xué)習(xí)打造的GPU芯片，那么這里還必須要提一下Tesla P100芯片使用的NVIDIA旗艦GP100核心。GP100的性能一公布，給車(chē)云菌的感覺(jué)就是NVIDIA這次回歸了GK110大核心時(shí)代注重雙精度運(yùn)算的設(shè)計(jì)，而且比之前更加變態(tài)。它每組SM單元中有64個(gè)FP32單元，但有32個(gè)FP64單元，F(xiàn)P64與FP32比例是1：2。這樣的設(shè)計(jì)意味著GP100的FP32 CUDA核心可以同時(shí)執(zhí)行2個(gè)FP16半精度運(yùn)算，因此FP16浮點(diǎn)性能高達(dá)21.6TFLOPS。

　　△NVIDIA GP100核心架構(gòu)示意圖

　　GPU并行運(yùn)算的特性很適合深度學(xué)習(xí)。據(jù)車(chē)云菌了解，NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學(xué)習(xí)超級(jí)計(jì)算機(jī)，由8顆GP100核心及2顆16核Xeon E5處理器組成，深度計(jì)算性能達(dá)到了170TFLOPS，號(hào)稱比250臺(tái)X86服務(wù)器還要強(qiáng)大。

　　△NVIDIA 超級(jí)計(jì)算機(jī)DGX-1 售價(jià)高達(dá)$129000，真心不便宜

　　在過(guò)去的兩年里，每次GTC大會(huì)的主題演講環(huán)節(jié)，黃仁勛都會(huì)將話題的重點(diǎn)放在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)研究上，并適時(shí)推出相關(guān)的新技術(shù)和新產(chǎn)品，而這些為NVIDIA之后進(jìn)行人工智能的研究奠定了基礎(chǔ)。今年也不例外。除了基于Pascal全新架構(gòu)平臺(tái)打造的Tesla P100芯片外，NVIDIA還發(fā)布了兩款Maxwell計(jì)算平臺(tái)下的全新GPU芯片—Tesla M40/M4，是為深度學(xué)習(xí)應(yīng)用而特別打造的。