谷歌、IBM、微軟的人工智能處理器
現(xiàn)在科技領(lǐng)域最火的是什么?人工智能、機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)顯然是熱點(diǎn)中的熱點(diǎn)。太多我們認(rèn)識(shí)中的不可能,被強(qiáng)大的機(jī)器學(xué)習(xí)、人工智能給顛覆了。
比如去年Deepmind的AlphaGo就在圍棋領(lǐng)域戰(zhàn)勝了世界冠軍李世石,讓人感覺(jué)不可思議,在AlphaGo之前的軟件,連業(yè)余六段左右的高手都贏不了,更遑論頂級(jí)職業(yè)選手!如果你是程序高手,有想法,是不是可以自己在家也能玩機(jī)器學(xué)習(xí)呢?稍微研究的深入一點(diǎn),發(fā)現(xiàn)完全不是這么回事兒。
筆者有朋友的孩子想在圍棋上有所建樹(shù)。他發(fā)現(xiàn),下圍棋的課外輔導(dǎo)班要花錢(qián),找人指導(dǎo)下棋也要花錢(qián),并且隨著孩子棋力水漲船高,是以幾何級(jí)數(shù)的價(jià)格增加的。他又聽(tīng)說(shuō)人工智能的圍棋已經(jīng)很厲害了,能不能干脆一次性投資,弄個(gè)下圍棋很厲害的軟件與配置,這樣就相當(dāng)于一直與一個(gè)高手下對(duì)手棋,對(duì)棋力增長(zhǎng)是有好處的。
4路TItan X,2路至強(qiáng)E5已經(jīng)很強(qiáng)……
我一想,這邏輯也說(shuō)得通,AlphaGo不也贏了人類高手并且人類在學(xué)AlphaGo下棋嗎?于是找了找,目前使用6700K處理器的計(jì)算機(jī)跑日本圍棋軟件Zen,可以有業(yè)余五六段的棋力,但這顯然不是他想要的。前幾天與趙治勛對(duì)弈的deepzen,配置要高很多,核心是2個(gè)至強(qiáng)E5 V4與4個(gè)TItan X做GPU計(jì)算,雖然不敵趙治勛,但畢竟顯示出來(lái)了可觀的棋力。
前幾天Deepmind團(tuán)隊(duì)又放出了消息,棋力大漲,明年初開(kāi)始重新下棋。我突發(fā)奇想,反正這老哥也不差錢(qián),如果谷歌團(tuán)隊(duì)公開(kāi)了軟件,會(huì)不會(huì)可以自己弄個(gè)單機(jī)版的AlphaGo?天天和比李世石更厲害的AI下圍棋肯定漲棋力更快啊。但是仔細(xì)一研究,不是這么回事兒,AlphaGo用的處理器,買(mǎi)!不!到!
谷歌人工智能的處理器TPU
這個(gè)表是谷歌發(fā)表《自然》雜志論文的時(shí)候給出的配置與棋力預(yù)估。當(dāng)時(shí)只是說(shuō)要多少CPU與GPU以及對(duì)應(yīng)的棋力。如果說(shuō)一個(gè)CPU對(duì)應(yīng)一個(gè)核心,現(xiàn)在的至強(qiáng)E5V4,已經(jīng)有22核心的產(chǎn)品了,而如果是對(duì)應(yīng)一個(gè)CPU,那么48個(gè)CPU可能就要很貴的刀片服務(wù)才行了,當(dāng)然了有萬(wàn)能的淘寶,二手機(jī)架式的刀片服務(wù)器也貴不到哪兒去。
Deepmind團(tuán)隊(duì)公布的當(dāng)時(shí)的配置,似乎讓人覺(jué)得單機(jī)版的AlphaGo并非遙不可及,且棋力足夠,在今年5月,谷歌又公布了其自己定制的處理器的細(xì)節(jié)。谷歌用的并非Intel或是AMD的處理器,而是自己針對(duì)機(jī)器學(xué)習(xí)優(yōu)化過(guò)的處理器,并命名為“張量處理單元(tensorflow process unit,TPU)。而AlphaGo就是構(gòu)建在TPU上的。
TPU的作用就是給機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)加速。谷歌對(duì)TPU具體怎么工作、有哪些指令都語(yǔ)焉不詳,作為局外人能獲得的信息有限,甚至連哪個(gè)半導(dǎo)體工廠代工的都沒(méi)人知道。谷歌說(shuō)TPU是一種輔助運(yùn)算工具,還是要有CPU和GPU的。核心在于TPU是8位的,而我們的處理器是64位,因此在神經(jīng)網(wǎng)絡(luò)計(jì)算上,TPU的單位功耗貢獻(xiàn)的計(jì)算能力上,要比傳統(tǒng)的CPU有很大的優(yōu)勢(shì),更適合大面積的分布式的計(jì)算。
IBM對(duì)于計(jì)算機(jī)模擬神經(jīng)的計(jì)算啟動(dòng),可能要比其它的企業(yè)更早。而研究的起源,也不能說(shuō)全自主的,而是有外界的因素,那就是DARPA(國(guó)防部高級(jí)計(jì)劃研究局)。
IBM研究模仿大腦的神經(jīng)計(jì)算,也來(lái)自于DARPA。自從2008年以來(lái),DARPA給了IBM5300萬(wàn)美元用來(lái)研究SyNapse(Systems of Neuromorphic AdapTIve PlasTIc Scalable Electronics,自適應(yīng)可伸縮神經(jīng)系統(tǒng),縮寫(xiě)的SyNapse單詞正好是觸突,神經(jīng)的構(gòu)成部分),而TrueNorth只是這個(gè)項(xiàng)目的一部分成果而已。
IBM的TrueNorth芯片
這項(xiàng)研究的意義是,我們今天的計(jì)算機(jī),處理和存儲(chǔ)是分離的,高度依賴總線進(jìn)行數(shù)據(jù)傳輸交換,即所謂馮·諾依曼體系。我們大腦的處理方式則不同,要知道神經(jīng)的傳輸速度并不快,但是大腦的優(yōu)勢(shì)是腦細(xì)胞多,靠的是大量分布式的處理,現(xiàn)有的模仿大腦的辦法,還是依賴處理器的數(shù)量堆積,所以能效比不高,而IBM的TrueNorth則是要打破這個(gè)屏障,在芯片上就完成對(duì)神經(jīng)元的模擬。2011年的原型就有256個(gè)神經(jīng)元的原型。
2014年,IBM的可編程神經(jīng)元達(dá)到了4096個(gè),可編程觸突2.56億,聯(lián)合神經(jīng)處理器有4096個(gè)。可以說(shuō)IBM的TrueNorth是無(wú)心插柳,研究啟動(dòng)的早,業(yè)內(nèi)深度學(xué)習(xí)熱、神經(jīng)網(wǎng)絡(luò)熱的時(shí)候,這顆處理器也成熟了,在IBM和DARPA的網(wǎng)站上,都有給予這個(gè)芯片進(jìn)行視頻內(nèi)容識(shí)別計(jì)算的成果演示,非常有意思,可以去看看。
微軟的FPGA
微軟啟動(dòng)Project Catapult還是在2012年。當(dāng)時(shí)微軟的掌舵人還是史蒂夫鮑爾默。微軟發(fā)現(xiàn),硬件提供商無(wú)法提供他們需要的硬件。過(guò)去微軟每年都要花費(fèi)數(shù)十億美元來(lái)購(gòu)置硬件,但現(xiàn)有的硬件對(duì)機(jī)器學(xué)習(xí)這些搜索算法的效
當(dāng)年比特幣挖礦機(jī),F(xiàn)PGA顯示出來(lái)比顯卡高效、省電得多的特性
微軟的路線是是通過(guò)FPGA(field programmable gate arrays,現(xiàn)場(chǎng)可編程門(mén)陣列),它的特色是進(jìn)行并行計(jì)算。還記得幾年前的比特幣狂潮嗎?最開(kāi)始人們是依賴顯卡或是GPU,到后來(lái)礦機(jī)的出現(xiàn),就是用的FPGA的能力來(lái)進(jìn)行挖礦,當(dāng)時(shí)也有瘋狂的人挖到了第一桶金。
運(yùn)行Bing頁(yè)面排名服務(wù)下,F(xiàn)PGA協(xié)助與沒(méi)有協(xié)助的對(duì)比
微軟的FPGA被應(yīng)用到了包括bing搜索引擎等領(lǐng)域,能夠顯著的提升效率。FPGA雖然編程困難,但是微軟正在嘗試將更多的應(yīng)用,比如Office365等,加入到通過(guò)FPGA來(lái)提升服務(wù)質(zhì)量上。微軟的FPGA來(lái)自Altera,有趣的是,英特爾以167億美元收購(gòu)了這個(gè)公司,是英特爾史上最大的并購(gòu)。
英特爾:研發(fā)與收購(gòu)并駕齊驅(qū)
前面我們說(shuō)了,微軟和英特爾這對(duì)長(zhǎng)期的伙伴,在微軟的FPGA使用的是來(lái)自Altera的技術(shù),英特爾就收購(gòu)了這個(gè)FPGA與SoC的企業(yè),現(xiàn)在再訪問(wèn)Altera的官網(wǎng),已經(jīng)是我們熟悉的Intel的Logo加上FPGA了,并且內(nèi)容上也是機(jī)器學(xué)習(xí)、自動(dòng)駕駛等熱門(mén)內(nèi)容。
當(dāng)然英特爾作為處理器、半導(dǎo)體領(lǐng)域的翹楚,對(duì)行業(yè)的觀察要比別人透徹得多。雖然旗下產(chǎn)品多來(lái)自于傳統(tǒng)CPU,但是英特爾一樣有核心產(chǎn)品,在機(jī)器學(xué)習(xí)領(lǐng)域有競(jìng)爭(zhēng)力,那就是至強(qiáng)phi融核處理器與至強(qiáng)phi協(xié)處理器。
發(fā)展順序是這樣的,英特爾現(xiàn)有的至強(qiáng)phi協(xié)處理器用來(lái)加速計(jì)算,后推出的之前phi融核處理器。融核處理器通過(guò)英特爾OPA來(lái)改變高性能計(jì)算的能耗效率與空間效率。在英特爾的官方新聞中,我們也看到了英特爾關(guān)于至強(qiáng)phi在加速機(jī)器學(xué)習(xí)的速度表現(xiàn)。當(dāng)然了,英特爾也沒(méi)停止收購(gòu)的步伐,有很多人工智能領(lǐng)域的公司被英特爾收入囊中。
如果我想從事該領(lǐng)域?
作為最火的領(lǐng)域,人工智能、機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)這些詞語(yǔ)見(jiàn)諸媒體很多,并且基本上企業(yè)開(kāi)出的薪水+股票都非常誘人,可以說(shuō)能人處于哄搶狀態(tài),價(jià)高者得。還記得AlphaGo的Deepmind嗎?它們最近也有招聘啟事。
從招聘的信息看,如果想成為Deepmind的研究科學(xué)家,一般來(lái)說(shuō)要有神經(jīng)、計(jì)算機(jī)領(lǐng)域的博士(PhD)頭銜以及靠譜的論文,他們才會(huì)考慮了,當(dāng)然其它崗位可能要求會(huì)低一些。
現(xiàn)在雖然火爆,但是實(shí)際上深度神經(jīng)網(wǎng)絡(luò)系統(tǒng)并不是太多,因此,高薪并從事前沿研究,并非那么容易,在看本文的讀者群中,肯定有大學(xué)的在校生,多讀書(shū)、努力學(xué)習(xí),考上世界一流大學(xué)的計(jì)算機(jī)、神經(jīng)等領(lǐng)域的專業(yè),是從事機(jī)器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)、人工智能這些領(lǐng)域的捷徑,并且我們可以看到,專門(mén)為機(jī)器學(xué)習(xí)優(yōu)化的硬件其實(shí)剛剛上路,未來(lái)很長(zhǎng)的時(shí)間內(nèi),這個(gè)領(lǐng)域依舊會(huì)持續(xù)火熱,因?yàn)槭澜缟系纳疃壬窠?jīng)網(wǎng)絡(luò)系統(tǒng)其實(shí)也并不多。
一個(gè)人的命運(yùn)啊,當(dāng)然要靠自我?jiàn)^斗,但是也要考慮歷史的進(jìn)程。而歷史剛剛打開(kāi)人工智能的窗口,距離里面的殿堂還有很長(zhǎng)的路要走,這個(gè)歷史的機(jī)遇已經(jīng)在面前了,是自我?jiàn)^斗改變命運(yùn)的時(shí)刻了,少年們。
回歸本文題目的問(wèn)題,事實(shí)上今天的機(jī)器學(xué)習(xí)、人工智能,最多的還是至強(qiáng)+GPU的架構(gòu),但是定制的TPU、FPGA進(jìn)行協(xié)處理,有事半功倍的效率。筆者個(gè)人認(rèn)為,目前的形式恐怕已經(jīng)不是效率最高的辦法,在未來(lái)機(jī)器大腦或許真的比我們更聰明。