2016年9月13日消息,NVIDIA在北京舉辦了GPU技術大會(GPU Tech Conference),這也是GTC第一次在國內舉辦。在這次大會上,NVIDIA發(fā)布了Tesla P4、P40深度學習芯片,此外黃仁勛也在北京與數(shù)以萬計的AI、游戲行業(yè)的開發(fā)者們分享了他對GPU和未來計算的認知。以下內容是根據黃仁勛在GTC China 2016上的演講實錄整理。
一、4年以前,AlexNet第一次帶來了深度學習的爆發(fā)
2012年一個年輕的研究員叫Alex Krizhevsky。在多倫多大學AI實驗室,他設計了一個可以學習的軟件,這個軟件靠自己就能進行視覺識別。深度學習這個時候已經發(fā)展了一段時間,可能有20年。
Alex所設計的這個網絡,它有一層一層的神經網絡,包括卷積神經網絡、激發(fā)層、輸入和輸出,可以進行區(qū)分。這樣一個神經網絡可以學會識別影像或者是規(guī)律。深層神經網絡所帶來的結果是它會非常有效,會超出你的想象,但是它進行訓練需要的計算資源超過了現(xiàn)代計算機的能力,它需要幾個月的時間去訓練一個網絡才能真正地識別圖像。
Alex當時的看法是,有一個叫做GPU的新型處理器,通過一種叫CUDA的計算模式,可以適用于并行計算,用于非常密集的訓練。2012年他當時設計了叫Alex的網絡,提交給了一個大規(guī)模計算視覺識別大賽,是一個全球的競賽,并且贏得了這個大賽。
AlexNet戰(zhàn)勝了所有由其他計算視覺專家所開發(fā)的算法。Alex當時只用兩個NVIDIA GTX580,在通過數(shù)據訓練了幾天后,AlexNet的結果和質量引起關注。所有搞計算視覺的科學家,所有的AI科學家都非常關注。在2012年,Alex Krizhevsky啟動了計算機深度學習的基礎,這是現(xiàn)代AI的一個大爆炸。他的工作和成果在全世界引起了很大反響。
我相信那個時刻會被記住,因為它確實改變了世界。之后有很多研究開始圍繞深度學習進行。2012年斯坦福大學的吳教授(吳恩達)和我們開發(fā)了一個非常大規(guī)模的GPU配置用于深度學習的訓練,很快在三年之后每一年都會有新的網絡出來,能夠不斷地戰(zhàn)勝其他方案獲得更好的記錄。
二、聲音和視覺輸入鋪墊了構造AI世界的基礎
到了2015年,谷歌和微軟都實現(xiàn)了人類般的視覺識別能力。它是由軟件寫就的,在GPU上經過訓練可以實現(xiàn)比人類更高的視覺識別能力。2015年百度也宣布他們的語音識別達到了超越人類的水平,這是非常重要的一個事件。這是第一次計算機能自己寫程序,實現(xiàn)超過人類的水平。
視覺和語音是兩個非常重要的感官輸入,是人類智能的基礎。現(xiàn)在我們已經有了一些基礎的支柱,讓我們能夠進一步推進AI的發(fā)展,這在之前是難以想象的。如果聲音和視覺的輸入值不可靠的話,怎么能夠有機器可以去學習,可以有人類一樣的行為。我們相信這個基礎已經有了,這也是為什么我們認為現(xiàn)在是AI時代的開始。
全世界的研究者都看到了這些結果,現(xiàn)在所有的AI實驗室都開始使用GPU跑深度學習,這樣他們也可以開始建立未來AI的基礎。基本上所有的AI研究者都開始用我們的GPU。
GPU的核心是模擬物理世界,我們用GPU創(chuàng)建虛擬世界用于游戲、設計,用于講故事,比如制作電影。模擬環(huán)境、模擬物理屬性、模擬周圍所看到的世界,構建虛擬世界的過程如同人類大腦在想象時進行的計算。因為深度學習的發(fā)展,使我們的工作進入新的階段,人工智能。對人類智能的模擬會是我們所做的最重要的工作之一,而且我們對此非常激動。
三、GPU計算滲透到深度學習各個領域
今天也是我們第一次在中國舉辦GTC大會,這次很大一部分內容會是關于人工智能和深度學習。我們是一個計算公司,SDK對于我們來講是最重要的產品,GTC是我們最重要的一場盛會。大家可以看一下過去幾年的成長,這是非常了不起的增速。
今年GTC有16000名人員參加。下載我們SDK的開發(fā)人員增長了3倍,達到了40萬開發(fā)人員。但最了不起的數(shù)字是深度學習開發(fā)人員在兩年之內有了25倍的增長,現(xiàn)在下載我們的深度神經網絡實驗室引擎的開發(fā)人員已經增長了25倍,下載了5萬5千次。
大家到底用它干什么呢?很多都是AI研究人員,他們來自于全球各地,現(xiàn)在所有的實驗室都會使用我們的GPU平臺來做自己的AI研究,有軟件公司、互聯(lián)網軟件提供商,還有互聯(lián)網公司、汽車公司、政府、醫(yī)療成像、財務、制造等公司?,F(xiàn)在用GPU深度學習的領域是非常廣的,非常了不起的。