面對(duì)市場(chǎng)疲軟和出口管制兩大風(fēng)險(xiǎn),英偉達(dá)憑借什么重回巔峰?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
AI芯片行業(yè)是全球科技行業(yè)最惹人注目的賽道,在這條賽道上,英偉達(dá)公司已經(jīng)耕耘10多年,最近,這家以GPU加速計(jì)算為核心競(jìng)爭(zhēng)力的公司遭遇了兩件煩心事:一是,英偉達(dá)三季度財(cái)報(bào)公布后,加密貨幣業(yè)務(wù)市場(chǎng)需求下降導(dǎo)致GPU庫(kù)存問題,影響未來(lái)業(yè)績(jī)展望,二是美國(guó)商務(wù)部工業(yè)安全局針對(duì)關(guān)鍵新興和基礎(chǔ)技術(shù)和相關(guān)產(chǎn)品地出口管制框架地提案征求開始,涉及AI技術(shù)、AI芯片、微處理器和量子技術(shù)等14個(gè)領(lǐng)域,英偉達(dá)股價(jià)受到?jīng)_擊,跌幅達(dá)到了高峰期的50%。
圖1:NVDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛
11月21日,在蘇州金雞湖國(guó)際會(huì)議中心,英偉達(dá)GTC大會(huì)現(xiàn)場(chǎng),5000多人的大會(huì)現(xiàn)場(chǎng)人頭攢動(dòng),英偉達(dá)CEO黃仁勛顯然沒有受到外部市場(chǎng)干擾,他帶來(lái)激情四溢的演講,他強(qiáng)調(diào)指出三大趨勢(shì):第一、摩爾定律已經(jīng)失效,影響全球的計(jì)算行業(yè),各行各業(yè)的計(jì)算需求與傳統(tǒng)計(jì)算極限之間逐漸擴(kuò)大的差距,英偉達(dá)徹底改變計(jì)算方式,首創(chuàng)GPU加速計(jì)算模型,滿足開發(fā)人員的需求,并幫助他們實(shí)現(xiàn)飛躍;第二、AI將改變HPC和超大規(guī)模計(jì)算,科學(xué)家正在融合物理模擬和AI預(yù)測(cè)方法來(lái)創(chuàng)建數(shù)量級(jí)更大的模型。HPC正在成為AI計(jì)算機(jī),并且為科學(xué)家、數(shù)據(jù)科學(xué)家和AI開發(fā)者所用。第三、AI讓世界變得更加自動(dòng)化,AI將賦能所有移動(dòng)的機(jī)器,數(shù)十億汽車,數(shù)百萬(wàn)輛汽車,接駁車,建筑機(jī)械以及數(shù)十億工業(yè)和服務(wù)機(jī)器人都將具備自主能力。
黃仁勛表示,英偉達(dá)正在重塑計(jì)算機(jī)圖形和未來(lái)計(jì)算,以及人工智能如何通過自主機(jī)器,實(shí)現(xiàn)工廠和物流現(xiàn)場(chǎng)自動(dòng)化,電子發(fā)燒友記者注意道,在云端訓(xùn)練和未來(lái)高性能計(jì)算重塑,英偉達(dá)做了完整的布局。
云端訓(xùn)練推出重量級(jí)產(chǎn)品:T4和HGX-2 GPU加速平臺(tái)
云計(jì)算正在進(jìn)入算力時(shí)代,云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等信息技術(shù)的快速發(fā)展和傳統(tǒng)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型,推動(dòng)數(shù)據(jù)呈現(xiàn)幾何級(jí)增長(zhǎng),帶來(lái)了大量可處理的數(shù)據(jù)存量和知識(shí)。
據(jù)IDC數(shù)據(jù),2020年全球公有云在算力投資比例將超過10%,成為資本開支重點(diǎn)。全球服務(wù)器市場(chǎng)總體呈現(xiàn)高景氣,量?jī)r(jià)齊升,下游的公有云廠商加速算力投資趨勢(shì)明顯。傳統(tǒng)大型算力需求主要通過超算中心的方式來(lái)實(shí)現(xiàn),主要依托國(guó)家和大型機(jī)構(gòu)投資,最近三年各大型公有云廠商包括Amazon、阿里巴巴均推出HPC超算業(yè)務(wù),其戰(zhàn)略布局云計(jì)算算力業(yè)務(wù)的方向明確。
據(jù)測(cè)算,公有云算力投資比例從2014年的0.01%增長(zhǎng)至2020年的11.75%,除了提供傳統(tǒng)的存儲(chǔ)服務(wù)外,主要的云廠商逐漸配置其計(jì)算能力,增加算力投資,同時(shí)私有云和傳統(tǒng)IT領(lǐng)域的算力配置也將逐步成為標(biāo)配。
針對(duì)云計(jì)算中心對(duì)于算力的不同層次需求,NVDIA采取了雙重戰(zhàn)略:第一,向上擴(kuò)展,與百度、騰訊和阿里巴巴合作,NVDIA推出了V100 HGX-2,一個(gè)具備強(qiáng)大算力的高性能系統(tǒng),既可做科學(xué)計(jì)算,也可做人工智能計(jì)算,能夠處理海量的數(shù)據(jù),解決為數(shù)不多的大問題;第二,橫向擴(kuò)展,NVIDIA推出T4 GPU產(chǎn)品,這是一臺(tái)小型計(jì)算系統(tǒng)、超大能量,功耗低,可以進(jìn)行大規(guī)模的數(shù)據(jù)中心的部署。
圖2:HGX-2橫空出世
黃仁勛幽默地說(shuō),HGX-2板子有點(diǎn)重,HGX-2大概300鎊-400鎊,連接8個(gè) V100 GPU,通過NVLink連接,總共1 PFLOPS。每個(gè) GPU 以 300 GB / s的速度與其他 GPU 通信,并且以每秒8 TB的速度訪問所有 256 GB 的顯存,其他計(jì)算機(jī)節(jié)點(diǎn)沒有能力提供這么強(qiáng)大的能力。400臺(tái)服務(wù)器被他手上HGX-2系統(tǒng)主板代替了。
比起它強(qiáng)大的功能,HGX-2重量已經(jīng)不是焦點(diǎn)。NVIDIA 的 HGX-2 在單節(jié)點(diǎn)中能夠提供 2 千萬(wàn)億次的計(jì)算性能,與僅使用 CPU 的服務(wù)器相比,它將 AI 機(jī)器學(xué)習(xí)工作負(fù)載的運(yùn)行速度提升近 550 倍,將 AI 深度學(xué)習(xí)工作負(fù)載的運(yùn)行速度提升近 300 倍,將高性能計(jì)算工作負(fù)載的運(yùn)行速度提升近 160 倍。
華為、騰訊、百度和浪潮等國(guó)內(nèi)主流云計(jì)算和服務(wù)器廠商均采用這個(gè)平臺(tái),華為智能計(jì)算業(yè)務(wù)部總裁邱隆表示,NVIDIA GPU計(jì)算平臺(tái)在AI、HPC等數(shù)據(jù)科學(xué)計(jì)算領(lǐng)域擁有領(lǐng)先優(yōu)勢(shì),作為NVIDIA HGX-2 的合作伙伴,華為將基于HGX-2架構(gòu)為用戶提供強(qiáng)大的計(jì)算性能,以滿足各類AI和高性能計(jì)算應(yīng)用。
接著,在GTC大會(huì)上,黃仁勛重磅發(fā)布了T4處理器。T4 基于全新 NVIDIA TuringTM 架構(gòu),采用多精度 Turing Tensor Core和全新 RT Core,與加速的容器化軟件堆棧相結(jié)合,提供規(guī)模空前的性能。70 瓦特 T4 GPU 大致相當(dāng)于一條巧克力糖的大小,可靈活適應(yīng)于標(biāo)準(zhǔn)服務(wù)器或任何開放計(jì)算項(xiàng)目的超大規(guī)模服務(wù)器設(shè)計(jì)。
T4 的多精度功能可支持 4 種不同精度等級(jí)的各類 AI 工作負(fù)載,助力實(shí)現(xiàn)突破性的 AI 性能,F(xiàn)P32精度能夠提供 8.1 TFLOPS,F(xiàn)P16 精度能夠提供 65 TFLOPS,INT8 精度能夠提供 130 TOPS,INT4精度能夠提供 260 TOPS。針對(duì) AI 推理工作負(fù)載,配備 2 個(gè) T4 GPU 的單個(gè)服務(wù)器最多可取代 54 臺(tái) CPU 服務(wù)器。針對(duì) AI 訓(xùn)練,配備 2 個(gè) T4 的單個(gè)服務(wù)器可取代 9 臺(tái)雙套接字 CPU 服務(wù)器。T4 GPU僅僅是開始,容器化的TRT推理服務(wù)器今天開源,可以在Kubernetes運(yùn)行。
NVDIA全球副總裁、中國(guó)區(qū)總經(jīng)理張建中對(duì)電子發(fā)燒友記者表示,今年T4推出,在推理方面也非常出色,眾多互聯(lián)網(wǎng)公司,包括頭條、美團(tuán)、小米等,以及電信、金融等領(lǐng)域廠商都開始在數(shù)據(jù)中心采用NVDIA的產(chǎn)品。我們對(duì)未來(lái)三年國(guó)內(nèi)的數(shù)據(jù)中心業(yè)務(wù)發(fā)展都是非常樂觀的。
發(fā)布RAPIDS機(jī)器學(xué)習(xí)加速堆棧
黃仁勛在GTC大會(huì)上指出,機(jī)器學(xué)習(xí)比深度學(xué)習(xí)市場(chǎng)更為廣闊。據(jù)分析師估計(jì),面向數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的服務(wù)器市場(chǎng)每年價(jià)值約為 200 億美元,加上科學(xué)分析和深度學(xué)習(xí)市場(chǎng),高性能計(jì)算市場(chǎng)總價(jià)值大約為 360 億美元。
RAPSID發(fā)布于2018年10月10日的GTC Europe大會(huì)上,是一款針對(duì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的GPU加速平臺(tái),它為數(shù)據(jù)科學(xué)家提供標(biāo)準(zhǔn)化的流水線式工具,數(shù)據(jù)處理速度較僅用CPU提升50倍。
機(jī)器學(xué)習(xí)典型地應(yīng)用場(chǎng)景,比如在電商系統(tǒng),亞馬遜借助機(jī)器學(xué)習(xí)來(lái)改善用戶對(duì)其業(yè)務(wù)的使用體驗(yàn),包括產(chǎn)品推薦,替代性產(chǎn)品預(yù)測(cè),欺詐檢測(cè),元數(shù)據(jù)驗(yàn)證與知識(shí)獲取。又比如醫(yī)療等行業(yè)中有大量結(jié)構(gòu)化數(shù)據(jù),平安國(guó)保險(xiǎn)業(yè)巨頭平安集團(tuán),其擁有近1.8億個(gè)人用戶,為深入洞察欺詐檢測(cè)等問題或預(yù)測(cè)人群疾病,平安科技數(shù)據(jù)科學(xué)家團(tuán)隊(duì)除了自身獨(dú)特地機(jī)器學(xué)習(xí)算法,也用到scikit-learn常用機(jī)器學(xué)習(xí)庫(kù),最近,平安科技使用了RAPSID,這個(gè)新開源地GPU加速平臺(tái),使用RAPSID和GPU加速PCA和DBSAN之后,工作執(zhí)行流程加快了80倍,數(shù)據(jù)訓(xùn)練和加載時(shí)間從幾天縮短到幾個(gè)小時(shí),這些都加速了公司做主動(dòng)預(yù)測(cè)并完善預(yù)防計(jì)劃。
黃仁勛表示,RAPIDS目前已經(jīng)被非常廣泛的采用,比如華大基因、中國(guó)移動(dòng)、平安科技等中國(guó)公司都宣布引入它進(jìn)行機(jī)器學(xué)習(xí)加速。
最后,黃仁勛介紹說(shuō),NVIDIA AGX系列,還有面向自主機(jī)器、機(jī)器人的XAVIER處理器現(xiàn)已全面投產(chǎn)。眾多車企都在圍繞自動(dòng)駕駛進(jìn)行開發(fā),放眼2020或是2021年的市場(chǎng)競(jìng)爭(zhēng)格局,整個(gè)行業(yè)正在快速變化當(dāng)中,人工智能從根本上推動(dòng)了這個(gè)改變。大家可以看到NVDIA把人工智能融入到計(jì)算機(jī)圖形到高性能計(jì)算,到自主機(jī)器和自動(dòng)駕駛。