前不久,一幅被硬件玩家津津樂道的照片在網上瘋傳:NVIDIA CEO黃仁勛像個DIY玩家般地搗騰著一臺電腦主機,而現(xiàn)場的唯一觀眾竟是特斯拉掌門人馬斯克。兩位大佬頗具生活化的一幕,實則蘊藏著NVIDIA對未來的野望。黃仁勛向馬斯克交付的產品是名為DGX-1的深度學習超級計算機,將被用于后者去年底新創(chuàng)辦的人工智能項目OpenAI。黃仁勛曾表示,3000 人花費三年時間才研發(fā)出這樣一款DGX-1,深度學習超級計算機的研發(fā)難度之大可見一斑。然而,就是因為DGX-1這個導火索,引發(fā)了NVIDIA和英特爾之間一場久違的口水戰(zhàn),其所涉及的GPU與CPU運算能力孰優(yōu)孰劣這個話題,最早可以追溯到八年之前的2008春季IDF大會。盡管打造出了一個又一個怪獸級產品,可是NVIDIA要想贏得應有的地位仍然是難上加難。
隨著GPU在通用計算領域得到廣泛應用,NVIDIA的優(yōu)勢正逐漸顯現(xiàn)出來。8月12日,NVIDIA公布了最新一季財報,總收入14.28億美元,同比增長24%,利潤達到了2.53億美元,同比增長873%。這樣的數(shù)據,給基數(shù)大卻增長乏力的英特爾造成了相當大的壓力。在8月中旬的秋季IDF上,英特爾宣布將于2017年推出專門為人工智能深度學習而設計的最新一代Xeon Phi處理器,代號Knights Mill,聲稱其運算能力比對手的產品快兩倍以上,矛頭顯然是直指NVIDIA的。面對英特爾的“發(fā)難”,NVIDIA很快就予以強硬回擊,指出英特爾使用的是一年半之前的老數(shù)據,居然以開普勒架構的GPU為比較對象,如果換成麥克斯韋GPU,Xeon Phi至少要落后兩成以上,帕斯卡就更不用說了。NVIDIA負責加速深度學習業(yè)務的副總裁伊恩·巴克還火上澆油地說:“隨著深度學習系統(tǒng)和人工智能領域日新月異的快速變化,這個領域的新來者可能并沒有意識到業(yè)內硬件和軟件方面的發(fā)展節(jié)奏。”
站在理智的角度看問題,在這一輪交鋒中,NVIDIA顯然是更占理的一方,產品性能更強是不爭的事實,再說英特爾在深度學習領域耕耘的時間并不長,跟 NVIDIA比起來確實是個新兵。但是,接下來英特爾數(shù)據中心集團副總裁杰森·衛(wèi)克斯曼在博客中提出了另一種觀點:“人工智能是新生事物。作為一個拓寬人工智能領域的創(chuàng)新催化劑,英特爾的領導力將至關重要。雖然現(xiàn)在很多人都在談論GPU對于機器深度學習的價值所在,但事實上去年為深度學習而研發(fā)的處理器中,使用到GPU的比例還不到3%。”這個3%究竟有多少水分并不重要,關鍵在于這番話充滿了“大欺小”的凌辱架勢,也讓NVIDIA不得不面對這樣一個事實——CPU才是必需品,而GPU只是可選配件。從馮·諾依曼的時代起,CPU核心論就成為了NVIDIA必須經歷的宿命。
在宣傳DGX-1時,NVIDIA的官方資料只強調其半精度(FP16)峰值性能最高可達170 Teraflops;包含8個Tesla P100 GPU加速器,每顆GPU搭載16GB顯存;7TB固態(tài)硬盤和雙萬兆以太網……就是閉口不提CPU的事,讓人不由得遐想這臺超級計算機是不是已經擺脫 X86 CPU了呢?不過事實并非如此,DGX-1還是需要兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內存,無法擺脫傳統(tǒng)計算機的標準架構。黃仁勛八年前就提出了GPU核心論,GPU的晶體管數(shù)量、復雜程度和運算能力也真的大幅超過CPU了,只可惜GPU始終不是計算機的必需品。游戲應用也是如此,哪怕獨顯的性能一直數(shù)倍于集顯,但英特爾核芯顯卡總是占據著七成以上的市場份額,考慮到成本、兼容性等諸多因素,性能上的王者與市場霸主在大部分情況下都是兩種概念。
從表面看NVIDIA是受了一些委屈,但這場口水戰(zhàn)其實更多地反映出了英特爾在轉型階段的底氣不足,先是用不客觀的對比來宣傳自家產品,繼而又憑借壟斷地位打壓對手氣勢。不管雙方在言辭上怎樣你來我往,都無法掩蓋NVIDIA在產品上更勝一籌的事實,也不能改變NVIDIA在人工智能時代成為計算領域的焦點、風頭蓋過英特爾的既定趨勢。沒錯,英特爾CPU是必需品,但英特爾總不至于激進得去阻止用戶添加NVIDIA設備吧。雖然未來超級計算機依舊用的是英特爾芯,可NVIDIA加速卡卻賣得更多也賺得更多,要想扭轉這一點,英特爾還有很長的路要走。對于NVIDIA來說,發(fā)展X86暫時還無路可走,而 ARM的懷抱永遠是敞開的,要是接下來ARM在服務器和超級計算機領域能發(fā)揮更大的作用,那么GPU核心論的大日子也就不再遙遠了。