黃仁勛的“廚房演講”,熬制的卻是英偉達(dá) GPU 史上最大性能飛躍
第一次,在自家的廚房里,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛開始了 GTC 2020 的演講。
「未來十年,數(shù)據(jù)中心的規(guī)模計算將成為標(biāo)準(zhǔn)?!拐f完,老黃從自家的烤箱里拿出了全新的安培(Ampere)架構(gòu) GPU,7nm 工藝,540 億晶體管,20 倍 AI 算力的提升。
每次帶來全新架構(gòu),都必然是一次「性能躍遷」。只是這次它不是開啟了一個全新的大門,而是作為最后一塊磚,補齊了英偉達(dá)在數(shù)據(jù)科學(xué)與 AI 應(yīng)用上的完整版圖。
去年的 GTC2019,黃教主罕見的沒有放出「重磅核彈」傳言中的下一代 7nm 產(chǎn)品以及新架構(gòu)也并沒有出現(xiàn),而更加強調(diào)「生態(tài)」優(yōu)勢與「落地」的英偉達(dá)卻仿佛要從側(cè)翼用「軟件生態(tài)」構(gòu)筑起一道護城河。
在高性能計算之下,收購「絕配」的高性能網(wǎng)絡(luò)公司 Mellanox 和 Cumulus Networks,借助這兩個公司組成的新業(yè)務(wù)部門,老黃開始逐漸加深其在數(shù)據(jù)中心領(lǐng)域的強勁增長。
今天,依靠這次帶來的新的 Ampere 圖形架構(gòu),在 AI 計算、數(shù)據(jù)中心等領(lǐng)域上讓英偉達(dá)獲得了全面的「能力升級」。
黃仁勛的「廚房演講」| 英偉達(dá)官方
英偉達(dá)之前的成長很大程度上是依靠其游戲 GPU 處理器。如今,英偉達(dá)逐漸開始在眾多人工智能 AI 應(yīng)用程序方面顯現(xiàn)巨大的增長潛力。英偉達(dá)在 AI 領(lǐng)域的處理器,可以幫助提高 AI 語意理解能力,優(yōu)化搜索引擎建議,甚至賦能公共云以及物流,零售和倉儲等垂直行業(yè)。
在疫情期間,這些行業(yè)和應(yīng)用成為「必需品」。巨大的推動力也為英偉達(dá)的收入和收益帶來了高于平均水平的增長。更重要的是,這也讓英偉達(dá)擺脫了短期加密貨幣的動蕩影響,轉(zhuǎn)身跨入了一個新的增長時代。
全面投產(chǎn)的新「核彈基地」老黃今天宣布,基于 NVIDIA Ampere 架構(gòu)的首個 GPU,即 NVIDIA A100,正在全面生產(chǎn)并向全球客戶發(fā)貨。
再說 NVIDIA A100 是「核彈」并不嚴(yán)謹(jǐn),它更像是一個「核彈基地」。A100 利用了英偉達(dá)安培架構(gòu)的設(shè)計突破,在其 8 代 GPU 中提供英偉達(dá)迄今為止最大的性能飛躍,將性能提高到其前輩的 20 倍。
NVIDIA A100 GPU | 英偉達(dá)官方
同時,它是一個端到端機器學(xué)習(xí)加速器——從數(shù)據(jù)分析到訓(xùn)練再到推理。第一次在一個平臺上來統(tǒng)一人工智能訓(xùn)練和推理。A100 是一個通用的工作負(fù)載加速器,它也是為數(shù)據(jù)分析、科學(xué)計算和云圖形設(shè)計的。
「云計算和人工智能的強大趨勢正在推動數(shù)據(jù)中心設(shè)計的結(jié)構(gòu)性轉(zhuǎn)變」黃仁勛說,「過去純 CPU 服務(wù)器的海洋,正在被 GPU 主導(dǎo)的加速計算基礎(chǔ)架構(gòu)所取代?!?/p>
黃仁勛說,買得越多,省得越多。(Buy more GPUs , the more money you save.)| 官方 Keynote
而貫徹「買更多,省更多」的宗旨,NVIDIA A100 將同時提高吞吐量并降低數(shù)據(jù)中心的成本。
A100 內(nèi)置了新的彈性計算技術(shù),可「靈活拆分」計算能力。多實例 GPU 能力允許每個 A100 GPU 被分割成多達(dá)七個獨立的實例來推斷任務(wù),而第三代 NVIDIA NVLink interconnect 技術(shù)允許多個 A100 GPU 作為一個巨型 GPU 運行,以完成更大的訓(xùn)練任務(wù)。
第一批利用 NVIDIA A100 GPU 的是微軟,它將利用 NVIDIA A100 的來訓(xùn)練圖靈自然語言生成,這個世界上最大的語言模型。疫情期間,這也讓外賣巨頭 DoorDash 獲得了更強的能力,「這有助于減少模型訓(xùn)練時間,加快機器學(xué)習(xí)的開發(fā)過程?!笵oorDash 的機器學(xué)習(xí)工程師 Gary Ren 說。早期采用者還包括國家實驗室和一些世界領(lǐng)先的高等教育和研究機構(gòu)。
NVIDIA A100 很快就會進(jìn)入云計算。包括 BAT 在內(nèi)的云業(yè)務(wù),字節(jié)跳動、谷歌云、亞馬遜云 (AWS) 等幾乎主流大廠都將在產(chǎn)品中加入 A100 GPU。
當(dāng)然關(guān)于 NVIDIA A100 GPU,英偉達(dá)認(rèn)為這是一項「技術(shù)設(shè)計突破」,英偉達(dá)自己總結(jié)了五個關(guān)鍵創(chuàng)新推動:
● NVIDIA 全新安培 Ampere 架構(gòu)——A100 的核心是 NVIDIA Ampere GPU 架構(gòu),它包含超過 540 億個晶體管,使其成為世界上最大的 7 納米處理器。
●使用第三代 Tensor Core AI 核心,現(xiàn)在更加靈活、更快、更容易使用。他們的擴展功能包括新的人工智能 TF32,它允許高達(dá) 20 倍的 FP32 精度的人工智能性能,沒有任何代碼更改。此外現(xiàn)在支持 FP64,為 HPC 應(yīng)用提供了比上一代多 2.5 倍的計算能力。
●多實例 GPU (Multi-instance GPU)——MIG,一個新的技術(shù)特性,可以將一個 A100 GPU 分割成多達(dá) 7 個單獨的 GPU,這樣它就可以為不同大小的任務(wù)提供不同程度的計算,提供最優(yōu)的利用率和最大的投資回報。
●第三代 NVIDIA NVLink——使 GPU 之間的高速連接加倍,從而在服務(wù)器上提供高效的性能擴展。
●結(jié)構(gòu)稀疏性——這種新的效率技術(shù)利用了人工智能數(shù)學(xué)固有的稀疏性,使性能提高了一倍。
NVIDIA A100 | 英偉達(dá)官方
總之,這些新特性使 NVIDIA A100 成為多樣化、高要求工作負(fù)載的理想選擇,包括人工智能培訓(xùn)和推理以及科學(xué)模擬、會話人工智能、推薦系統(tǒng)、基因組學(xué)、高性能數(shù)據(jù)分析、地震建模和財務(wù)預(yù)測。
今天英偉達(dá)也開始與開源社區(qū)合作,將端到端 GPU 加速引入 Apache Spark 3.0,這是一個用于大數(shù)據(jù)處理的分析引擎,全世界有 50 多萬數(shù)據(jù)科學(xué)家使用它。NVIDIA 的企業(yè)計算主管 Manuvir Das 說:「數(shù)據(jù)分析是當(dāng)今企業(yè)和研究人員面臨的最大的高性能計算挑戰(zhàn)?!埂笍?ETL 到訓(xùn)練再到推理,整個 Spark 3.0 的 GPU 加速提供了最終連接大數(shù)據(jù)潛力和人工智能能力所需的性能和規(guī)模?!笰dobe 是首批在 Databricks 上運行 Spark 3.0 預(yù)覽版的公司之一。在最初的測試中,它的性能提高了 7 倍,節(jié)省了 90% 的成本。它使用 GPU 加速數(shù)據(jù)分析,用于 Adobe 體驗云中的產(chǎn)品開發(fā),并支持支持?jǐn)?shù)字業(yè)務(wù)的功能。
從「新玩家」到寶馬工廠,汽車行業(yè)的全面「滲透」NVIDIA DRIVE AGX 正為汽車行業(yè)初創(chuàng)公司提供 AI 驅(qū)動力。
在 GTC Digital 期間,電動汽車和自動駕駛汽車初創(chuàng)公司小馬智行(Pony.ai)、Canoo 和法拉第未來(Faraday Future)紛紛宣布借助 NVIDIA DRIVE AGX 計算平臺開發(fā)汽車。這個高性能、高能效的平臺可實現(xiàn)跨級別的自動駕駛,幫助企業(yè)進(jìn)行可靠的軟件定義車輛開發(fā)。
這幾家公司全都加入了一個廣泛的全球生態(tài)系統(tǒng)。該系統(tǒng)中的汽車制造商、一級供應(yīng)商、卡車制造商、傳感器供應(yīng)商、Robotaxi 公司和軟件初創(chuàng)公司均在 NVIDIA DRIVE 上進(jìn)行開發(fā)。
自動駕駛技術(shù)公司小馬智行正在 NVIDIA DRIVE AGX Pegasus 上開發(fā)其新一代 Robotaxi 車隊。自 2018 年以來,該公司一直在加利福尼亞州和中國測試自動駕駛車輛的叫車服務(wù)。今年 4 月,小馬智行開始在加利福尼亞州爾灣市提供自動派送服務(wù),幫助因新冠疫情影響而在該地區(qū)隔離的人。
借助 DRIVE AGX Pegasus 自動駕駛平臺來滿足 Robotaxi 上市所需的海量計算需求。Pegasus 計算平臺可實現(xiàn)每秒 320 萬億次(TOPS)深度學(xué)習(xí)運算,內(nèi)置兩個 NVIDIA Xavier 處理器和兩塊 NVIDIA Turing Tensor Core GPU。
電動汽車初創(chuàng)公司 Canoo 推出了一款時尚的電動汽車,這款汽車的風(fēng)格類似于大眾經(jīng)典車型 Microbus 的未來風(fēng)格。這款專用于共享出行服務(wù)的汽車將于 2021 年下半年投入生產(chǎn)。
Canoo 汽車將配備 NVIDIA DRIVE AGX Xavier 驅(qū)動的 AI 輔助駕駛功能。該計算平臺具有 30 TOPS 物體探測和傳感器融合性能,能夠運行構(gòu)建十字路口警報、盲點探測和行人探測功能的先進(jìn)算法,以及自適應(yīng)巡航控制和車道偏離預(yù)防等便捷功能。
軟件定義的 DRIVE AGX Xavier 還能引入更多市面上推出的高級功能,例如自動車道變換、交通信號識別和規(guī)避轉(zhuǎn)向等。
小鵬最新推出的 P7 的 XPILOT3.0 就是使用了英偉達(dá) DRIVETM AGX Xavier 平臺。目前,小鵬還宣布將在下一代生產(chǎn)車型中利用 DRIVE 平臺,小鵬自動駕駛副總裁吳新宙博士說,「我們非常高興能在下一代電動汽車生產(chǎn)模式上擴大與 NIVIDA 的合作?!?/p>
就連許久未發(fā)聲的新造車鼻祖法拉第未來(Faraday Future)也宣布將在其旗艦豪華 FF 91 電動車上部署 NVIDIA DRIVE AGX Xavier 平臺,開發(fā)新一代 FF91。根據(jù) FF 的新計劃,F(xiàn)F 91 將在成功完成股權(quán)融資約 9 個月后開始交付。最新發(fā)布的 FF 81 EV 還將配備 DRIVE AGX Xavier,以及未來的型號和下一代核心技術(shù)。
寶馬集團也在今天宣布,公司已經(jīng)選擇了新的 NVIDIA Isaac 機器人平臺來加強其汽車工廠——利用建立在先進(jìn)的人工智能計算和可視化技術(shù)上的物流機器人。
「利用人工智能和機器人技術(shù)上的突破,創(chuàng)造出可高度定制、準(zhǔn)時化、順序化的下一代生產(chǎn)模式?!估宵S說。
寶馬集團負(fù)責(zé)物流的高級副總裁 Jürgen Maidl 說:「最終,大量可能的配置成為了寶馬集團在三個基本領(lǐng)域的挑戰(zhàn)——計算、物流規(guī)劃和數(shù)據(jù)分析,」寶馬集團 (BMW Group) 的供應(yīng)鏈需要從 4500 多個供應(yīng)商站點向工廠輸送數(shù)百萬件零部件,涉及 23 萬個獨特的零部件編號。目前,寶馬銷售的車輛平均有 100 種不同的選擇,導(dǎo)致 99% 的客戶訂單彼此之間存在獨特的差異。這給工廠物流帶來了巨大的挑戰(zhàn)。
合作的核心是實現(xiàn)一個基于英偉達(dá)技術(shù)的端到端系統(tǒng)——從培訓(xùn)和測試到部署——使用一種軟件架構(gòu)開發(fā)的機器人,運行在英偉達(dá)的開放 Isaac 機器人平臺上。寶馬集團的目標(biāo)是提高物流工廠的流程,以生產(chǎn)定制配置的汽車更迅速和更有效。一旦開發(fā)完成,該系統(tǒng)將部署到寶馬集團的全球工廠。
英偉達(dá)的增長源泉黃仁勛一直說,人工智能是未來增長的巨大潛在驅(qū)動力。
第一個驅(qū)動因素是「推理」的概念。推理,也稱為推理引擎,將邏輯規(guī)則應(yīng)用于知識庫以形成新信息。例如,可以利用客戶購買歷史、興趣以及他們的位置等事實來確定針對性的營銷計劃。
而人工智能增長的第二個推動力是實現(xiàn)突破的模型算法能力。英偉達(dá)的產(chǎn)品具有低延遲性能,而 AI 應(yīng)用程序例如語言識別/理解程序和互聯(lián)網(wǎng)搜索推薦系統(tǒng),這些系統(tǒng)現(xiàn)在正在使用深度學(xué)習(xí)。
第三個驅(qū)動力是公共云的增長。公共云的增長來自許多在云中開發(fā) AI 軟件的 AI 初創(chuàng)公司。黃仁勛(Jensen Huang)表示,人工智能初創(chuàng)企業(yè)數(shù)量達(dá)數(shù)千家。由于公共云可以支持規(guī)模較小且剛剛起步的公司,因此易于使用。
人工智能的第四增長動力是垂直行業(yè)。這包括物流,零售和倉儲。沃爾瑪(WMT),美國郵政(USPS)和美國運通(AXP)等公司/組織擁有大量需要分析/預(yù)測分析的數(shù)據(jù)。
同時,這一領(lǐng)域還需要邊緣 AI 計算。這樣能保證進(jìn)行實時操作,例如包括機器人、自動駕駛汽車的某些操作,數(shù)據(jù)創(chuàng)建以及需要在幾毫秒內(nèi)發(fā)生的決策。
我們可能會更容易的從 AI 中看到現(xiàn)實世界的解決方案:增強的購物體驗(更好的庫存系統(tǒng)/更智能的布局/更智能的結(jié)帳系統(tǒng)),增強的汽車自動駕駛視覺計算性能/解決方案,實時交通監(jiān)控以確保更安全的道路,基因組計算,5G 加速等等。
這些各種行業(yè)中 AI 應(yīng)用程序的增長空間可能會給英偉達(dá)帶來一個可以實現(xiàn)數(shù)年的持續(xù)增長的領(lǐng)域。Grand View Research 估計,到 2025 年,全球 AI 市場將以每年約 46%的速度增長。
我們發(fā)現(xiàn),英偉達(dá)不在是一個單純的 GPU 硬件公司,它正在成長為一個「生態(tài)型」的基礎(chǔ)設(shè)施,跑在一個高速增長的時代下。