重磅:蘋(píng)果秘密研發(fā)多年的人工智能終遭解密
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋(píng)果似乎對(duì)此無(wú)動(dòng)于衷,被認(rèn)為在人工智能領(lǐng)域嚴(yán)重落后,除了語(yǔ)音助手Siri,似乎沒(méi)有更多作為。但真實(shí)情況或許與外界猜測(cè)的完全不同,Backchannel主編Steven Levy近日走訪(fǎng)了蘋(píng)果,發(fā)現(xiàn)這家公司其實(shí)先于業(yè)界使用了時(shí)髦的深度學(xué)習(xí)技術(shù),并將其用在了除Siri外的方方面面。閱讀本文你可以迅速了解蘋(píng)果哪些產(chǎn)品已被機(jī)器學(xué)習(xí)入侵,為何它能秘密研發(fā)新技術(shù)多年,機(jī)器學(xué)習(xí)給其文化和原則帶來(lái)了怎樣的挑戰(zhàn),它又是如何與主流業(yè)界“對(duì)著干”……
Park 1
2014年6月30日,Siri迎來(lái)了一次腦部移植。
再三年前,蘋(píng)果是第一家將智能助理整合進(jìn)其操作系統(tǒng)的主流公司。而Siri則是蘋(píng)果對(duì)一個(gè)收購(gòu)而來(lái)的獨(dú)立應(yīng)用的改進(jìn),它還在2010年吞下了開(kāi)發(fā)團(tuán)隊(duì)。對(duì)于Siri,最初的評(píng)價(jià)令人欣喜,但后來(lái)的幾個(gè)月到幾年中,用戶(hù)對(duì)它的缺點(diǎn)越來(lái)越不耐煩。它常常錯(cuò)誤理解指令,怎么調(diào)整也沒(méi)沅改進(jìn)。
所以在上面提到的那個(gè)日期,蘋(píng)果將Siri的語(yǔ)音識(shí)別移植到了基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)上。這一服務(wù)首先面向美國(guó)用戶(hù),并在8月15日推向全球。一些早期技術(shù)仍有用,包括隱馬爾可夫模型,但現(xiàn)在系統(tǒng)使用的是機(jī)器學(xué)習(xí)技術(shù),包括DNN(深度神經(jīng)網(wǎng)絡(luò)),卷積神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期記憶單位,封閉復(fù)發(fā)性單位(gated recurrent units),以及n-grams等。用戶(hù)升級(jí)后,Siri雖然看起來(lái)還是一樣,但經(jīng)過(guò)了深度學(xué)習(xí)的加強(qiáng)。
與其它底層改進(jìn)一樣,由于不愿向競(jìng)爭(zhēng)者暴露自己,蘋(píng)果沒(méi)有公布Siri的進(jìn)展。如果用戶(hù)注意到了什么,也只是它犯的錯(cuò)變少了。蘋(píng)果也表示,準(zhǔn)確度的改善令人震驚。
Eddy Cue
蘋(píng)果互聯(lián)網(wǎng)軟件及服務(wù)部高級(jí)副總裁Eddy Cue表示,“這次改進(jìn)的效果如此明顯,以至于進(jìn)行了重新測(cè)試,確保沒(méi)人算錯(cuò)小數(shù)點(diǎn)。”
Siri轉(zhuǎn)變的故事會(huì)讓人工智能領(lǐng)域的人皺起眉頭,不是因?yàn)樯窠?jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)的提升,而是因?yàn)樘O(píng)果對(duì)技術(shù)如此熟練又如此低調(diào)。直到最近,雖然蘋(píng)果在AI領(lǐng)域加大了招聘力度,也做出了一些高調(diào)的收購(gòu),但外界還是認(rèn)為它在最為激烈的AI競(jìng)爭(zhēng)中稍顯落后。由于蘋(píng)果一直守口如瓶,連AI行家也不知道它在機(jī)器學(xué)習(xí)上有何作為。在斯坦福教授人工智能歷史一課的Jerry Kaplan表示,“蘋(píng)果不屬于社區(qū)的一分子,就像是AI領(lǐng)域的NSA(美國(guó)國(guó)家安全局)”。一般認(rèn)為,如果蘋(píng)果的努力與Google和Facebook一樣認(rèn)真,應(yīng)該會(huì)被外界所知。
艾倫AI研究所的Oren Etzioni表示,“Google、Facebook和微軟有著頂尖的機(jī)器學(xué)習(xí)人才。蘋(píng)果確實(shí)聘用了一些人,但機(jī)器學(xué)習(xí)的五大領(lǐng)袖中有誰(shuí)為蘋(píng)果工作?蘋(píng)果有語(yǔ)音識(shí)別技術(shù),但除此之外機(jī)器學(xué)習(xí)還能幫什么忙呢。”
Park 2
然而,就在本月初,蘋(píng)果秘密地展示了機(jī)器學(xué)習(xí)在自家產(chǎn)品上的應(yīng)用。但沒(méi)有展示給Oren Etzioni看,而是展示給了我。當(dāng)天,我的大部分時(shí)間都待在了蘋(píng)果庫(kù)比提諾飛船總部大樓里,在蘋(píng)果高管的陪同下,感受了蘋(píng)果產(chǎn)品在人工智能與機(jī)器學(xué)習(xí)上的緊密結(jié)合。(高管包括Eddy Cue,副總裁兼市場(chǎng)營(yíng)銷(xiāo)主管Phil Schiller,以及軟件主管兼高級(jí)副總裁Craig Federighi)同時(shí)在場(chǎng)的還有負(fù)責(zé)開(kāi)發(fā)Siri的專(zhuān)家。當(dāng)我們都就坐以后,他們給我看了寫(xiě)滿(mǎn)了兩頁(yè)紙的機(jī)器學(xué)習(xí)應(yīng)用,一些是已經(jīng)投入使用的產(chǎn)品或服務(wù),一些是還在討論中的項(xiàng)目。
如果你是一名iPhone用戶(hù),大概已經(jīng)受益于機(jī)器學(xué)習(xí)所帶來(lái)的用戶(hù)體驗(yàn)的提升。但與直覺(jué)相反,機(jī)器學(xué)習(xí)并不僅僅應(yīng)用于Siri上。識(shí)別陌生來(lái)電,在解鎖后列出你最常使用的應(yīng)用,或者在提醒事項(xiàng)中標(biāo)記了一個(gè)約會(huì)(但你并沒(méi)有將之放入日程表中),以及自動(dòng)顯示附近標(biāo)記的酒店,這些在蘋(píng)果全面擁抱機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)后,都能做得更加盡善盡美。
對(duì),這就是傳說(shuō)中的“Apple Brain”,已經(jīng)內(nèi)置于你的iPhone中。
用到了神經(jīng)網(wǎng)絡(luò)的面部識(shí)別
“機(jī)器學(xué)習(xí)”,一名專(zhuān)家說(shuō),“現(xiàn)在在蘋(píng)果的產(chǎn)品及服務(wù)里無(wú)處不在”。Apple store使用深度學(xué)習(xí)辨別騙保行為,公測(cè)版操作系統(tǒng)收到的反饋也會(huì)使用人工智能篩選一遍,找出有用的反饋報(bào)告。還有蘋(píng)果的News應(yīng)用,采用機(jī)器學(xué)習(xí)挑選出你可能感興趣的新聞源。Apple Watch也利用到了機(jī)器學(xué)習(xí),檢測(cè)用戶(hù)在鍛煉狀態(tài)還是僅僅在閑逛。還有就是眾所周知的相機(jī)人臉識(shí)別,iPhone早已搭載這項(xiàng)技術(shù)。在Wi-Fi信號(hào)較弱的情況下,出于電量考慮,iOS還會(huì)建議你使用蜂窩網(wǎng)絡(luò)。它甚至能分辨出拍攝視頻的好壞,并在點(diǎn)擊一個(gè)按鈕之后,快速把一組相關(guān)的視頻剪輯到一起。當(dāng)然,這些蘋(píng)果的競(jìng)爭(zhēng)對(duì)手們做的也不賴(lài),但高管們強(qiáng)調(diào),蘋(píng)果是唯一一家在用戶(hù)隱私及用戶(hù)體驗(yàn)上取得平衡的公司。當(dāng)然,要在 iOS 設(shè)備上達(dá)到這一標(biāo)準(zhǔn),也只有蘋(píng)果能做到。
對(duì)蘋(píng)果來(lái)說(shuō),人工智能并非新玩意兒。早在上世紀(jì)90年代,蘋(píng)果推出牛頓(Newton)平板時(shí),配套的觸控筆就采用了一定程度的人工智能,用以識(shí)別用戶(hù)輸入的字符。這一研究成果目前還在為蘋(píng)果帝國(guó)發(fā)光發(fā)熱,即Apple Watch上面的中文字符識(shí)別系統(tǒng)。這一系統(tǒng)允許用戶(hù)輸入極為潦草的筆劃仍能精準(zhǔn)識(shí)別。(這些功能數(shù)十年以來(lái)都是由統(tǒng)一的機(jī)器學(xué)習(xí)團(tuán)隊(duì)在研發(fā))當(dāng)然,早期的機(jī)器學(xué)習(xí)極為原始,現(xiàn)在大行其道的深度學(xué)習(xí)在當(dāng)時(shí)仍處于襁褓之中?,F(xiàn)在人工智能與機(jī)器學(xué)習(xí)成為人必言之的顯學(xué),蘋(píng)果在這方面一直飽受批評(píng)。近幾周,TIm Cook終于發(fā)話(huà),表示蘋(píng)果并非在人工智能方面沒(méi)有著力,僅僅是宣傳較少。現(xiàn)在,高管們終于已改悶聲做事的做法,將蘋(píng)果在人工智能方面的成果公之于眾。
機(jī)器學(xué)習(xí)用于Apple Watch的健康應(yīng)用
“蘋(píng)果在過(guò)去的五年里增長(zhǎng)迅猛”,Phil Schiller說(shuō),“我們的產(chǎn)品的改進(jìn)速度也非???,A系列的處理芯片每年都有不小的性能突破,這使得我們擁有更加充裕的性能,將越來(lái)越多的機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到終端產(chǎn)品上。機(jī)器學(xué)習(xí)有不少好東西,而我們也有能力用好它”。
即使蘋(píng)果擁抱機(jī)器學(xué)習(xí)的熱情絲毫不亞于任何硅谷科技公司,但他們對(duì)于機(jī)器學(xué)習(xí)的使用仍是克制的。這幫庫(kù)比提諾的天才們并不認(rèn)為機(jī)器學(xué)習(xí)是解決一切問(wèn)題的靈丹妙藥。人工智能是未來(lái)的交互方式,但觸摸屏幕,平板電腦,面向?qū)ο缶幊淘谔囟〞r(shí)期一樣發(fā)揮了相同的作用。在蘋(píng)果看來(lái),機(jī)器學(xué)習(xí)并非其他公司所說(shuō),是人機(jī)交互的終極答案。“人工智能與以往改變?nèi)藱C(jī)交互的各種媒介并無(wú)本質(zhì)區(qū)別”,Eddy Cue 說(shuō)。蘋(píng)果對(duì)于機(jī)器是否將取代人類(lèi)這樣老生常談的討論也并無(wú)興趣。與預(yù)期相同,蘋(píng)果并沒(méi)有承認(rèn)造車(chē)計(jì)劃,也沒(méi)有談及自制電視劇的傳言,但蘋(píng)果的工程師們明確指出,他們不會(huì)造出類(lèi)似“天網(wǎng)”的東西。
“我們使用技術(shù)來(lái)解決以前做不了的事情,已經(jīng)改進(jìn)舊有范式”,Schiller說(shuō),“我們確保每項(xiàng)技術(shù)都能以最蘋(píng)果的方式應(yīng)用到產(chǎn)品上”。
之后,他們對(duì)于上述觀點(diǎn)展開(kāi)了進(jìn)一步的闡釋。如,人工智能在多大程度上重塑了蘋(píng)果的生態(tài)系統(tǒng)。蘋(píng)果研發(fā)人工智能的初衷是,彌補(bǔ)缺乏搜索引擎帶來(lái)的用戶(hù)體驗(yàn)缺失。(搜索引擎能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其快速成熟)此間,高管們?cè)俅螐?qiáng)調(diào)了蘋(píng)果對(duì)于保證用戶(hù)隱私的決心。(即使這樣將限制用戶(hù)數(shù)據(jù)的使用,從而阻礙機(jī)器學(xué)習(xí)的效果)高管們強(qiáng)調(diào),這些障礙并非不可逾越。
這個(gè)“大腦”有多大?iPhone上有多少用戶(hù)數(shù)據(jù)緩存可供機(jī)器學(xué)習(xí)調(diào)用?工程師們的回答讓我驚訝:“平均200Mb,具體多少取決于用戶(hù)信息的多寡。”(為節(jié)約存儲(chǔ)空間,緩存會(huì)時(shí)不時(shí)被清理出去)。這些信息包括了應(yīng)用的使用習(xí)慣,與他人的交互,神經(jīng)網(wǎng)絡(luò)處理,還有“自然語(yǔ)言模型”。還有對(duì)象識(shí)別,人臉識(shí)別,場(chǎng)景識(shí)別等供神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
對(duì)于蘋(píng)果來(lái)說(shuō),這些數(shù)據(jù)都是你的私人信息,并不會(huì)被上傳到網(wǎng)絡(luò)及云端。