眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋果似乎對此無動于衷,被認為在人工智能領(lǐng)域嚴重落后,除了語音助手Siri,似乎沒有更多作為。但真實情況或許與外界猜測的完全不同,Backchannel主編Steven Levy近日走訪了蘋果,發(fā)現(xiàn)這家公司其實先于業(yè)界使用了時髦的深度學習技術(shù),并將其用在了除Siri外的方方面面。閱讀本文你可以迅速了解蘋果哪些產(chǎn)品已被機器學習入侵,為何它能秘密研發(fā)新技術(shù)多年,機器學習給其文化和原則帶來了怎樣的挑戰(zhàn),它又是如何與主流業(yè)界“對著干”……
Park 1
2014年6月30日,Siri迎來了一次腦部移植。
再三年前,蘋果是第一家將智能助理整合進其操作系統(tǒng)的主流公司。而Siri則是蘋果對一個收購而來的獨立應(yīng)用的改進,它還在2010年吞下了開發(fā)團隊。對于Siri,最初的評價令人欣喜,但后來的幾個月到幾年中,用戶對它的缺點越來越不耐煩。它常常錯誤理解指令,怎么調(diào)整也沒沅改進。
所以在上面提到的那個日期,蘋果將Siri的語音識別移植到了基于神經(jīng)網(wǎng)絡(luò)的系統(tǒng)上。這一服務(wù)首先面向美國用戶,并在8月15日推向全球。一些早期技術(shù)仍有用,包括隱馬爾可夫模型,但現(xiàn)在系統(tǒng)使用的是機器學習技術(shù),包括DNN(深度神經(jīng)網(wǎng)絡(luò)),卷積神經(jīng)網(wǎng)絡(luò),長短期記憶單位,封閉復(fù)發(fā)性單位(gated recurrent units),以及n-grams等。用戶升級后,Siri雖然看起來還是一樣,但經(jīng)過了深度學習的加強。
與其它底層改進一樣,由于不愿向競爭者暴露自己,蘋果沒有公布Siri的進展。如果用戶注意到了什么,也只是它犯的錯變少了。蘋果也表示,準確度的改善令人震驚。
Eddy Cue
蘋果互聯(lián)網(wǎng)軟件及服務(wù)部高級副總裁Eddy Cue表示,“這次改進的效果如此明顯,以至于進行了重新測試,確保沒人算錯小數(shù)點。”
Siri轉(zhuǎn)變的故事會讓人工智能領(lǐng)域的人皺起眉頭,不是因為神經(jīng)網(wǎng)絡(luò)對系統(tǒng)的提升,而是因為蘋果對技術(shù)如此熟練又如此低調(diào)。直到最近,雖然蘋果在AI領(lǐng)域加大了招聘力度,也做出了一些高調(diào)的收購,但外界還是認為它在最為激烈的AI競爭中稍顯落后。由于蘋果一直守口如瓶,連AI行家也不知道它在機器學習上有何作為。在斯坦福教授人工智能歷史一課的Jerry Kaplan表示,“蘋果不屬于社區(qū)的一分子,就像是AI領(lǐng)域的NSA(美國國家安全局)”。一般認為,如果蘋果的努力與Google和Facebook一樣認真,應(yīng)該會被外界所知。
艾倫AI研究所的Oren Etzioni表示,“Google、Facebook和微軟有著頂尖的機器學習人才。蘋果確實聘用了一些人,但機器學習的五大領(lǐng)袖中有誰為蘋果工作?蘋果有語音識別技術(shù),但除此之外機器學習還能幫什么忙呢。”
Park 2
然而,就在本月初,蘋果秘密地展示了機器學習在自家產(chǎn)品上的應(yīng)用。但沒有展示給Oren Etzioni看,而是展示給了我。當天,我的大部分時間都待在了蘋果庫比提諾飛船總部大樓里,在蘋果高管的陪同下,感受了蘋果產(chǎn)品在人工智能與機器學習上的緊密結(jié)合。(高管包括Eddy Cue,副總裁兼市場營銷主管Phil Schiller,以及軟件主管兼高級副總裁Craig Federighi)同時在場的還有負責開發(fā)Siri的專家。當我們都就坐以后,他們給我看了寫滿了兩頁紙的機器學習應(yīng)用,一些是已經(jīng)投入使用的產(chǎn)品或服務(wù),一些是還在討論中的項目。
如果你是一名iPhone用戶,大概已經(jīng)受益于機器學習所帶來的用戶體驗的提升。但與直覺相反,機器學習并不僅僅應(yīng)用于Siri上。識別陌生來電,在解鎖后列出你最常使用的應(yīng)用,或者在提醒事項中標記了一個約會(但你并沒有將之放入日程表中),以及自動顯示附近標記的酒店,這些在蘋果全面擁抱機器學習及神經(jīng)網(wǎng)絡(luò)后,都能做得更加盡善盡美。
對,這就是傳說中的“Apple Brain”,已經(jīng)內(nèi)置于你的iPhone中。
用到了神經(jīng)網(wǎng)絡(luò)的面部識別
“機器學習”,一名專家說,“現(xiàn)在在蘋果的產(chǎn)品及服務(wù)里無處不在”。Apple store使用深度學習辨別騙保行為,公測版操作系統(tǒng)收到的反饋也會使用人工智能篩選一遍,找出有用的反饋報告。還有蘋果的News應(yīng)用,采用機器學習挑選出你可能感興趣的新聞源。Apple Watch也利用到了機器學習,檢測用戶在鍛煉狀態(tài)還是僅僅在閑逛。還有就是眾所周知的相機人臉識別,iPhone早已搭載這項技術(shù)。在Wi-Fi信號較弱的情況下,出于電量考慮,iOS還會建議你使用蜂窩網(wǎng)絡(luò)。它甚至能分辨出拍攝視頻的好壞,并在點擊一個按鈕之后,快速把一組相關(guān)的視頻剪輯到一起。當然,這些蘋果的競爭對手們做的也不賴,但高管們強調(diào),蘋果是唯一一家在用戶隱私及用戶體驗上取得平衡的公司。當然,要在 iOS 設(shè)備上達到這一標準,也只有蘋果能做到。
對蘋果來說,人工智能并非新玩意兒。早在上世紀90年代,蘋果推出牛頓(Newton)平板時,配套的觸控筆就采用了一定程度的人工智能,用以識別用戶輸入的字符。這一研究成果目前還在為蘋果帝國發(fā)光發(fā)熱,即Apple Watch上面的中文字符識別系統(tǒng)。這一系統(tǒng)允許用戶輸入極為潦草的筆劃仍能精準識別。(這些功能數(shù)十年以來都是由統(tǒng)一的機器學習團隊在研發(fā))當然,早期的機器學習極為原始,現(xiàn)在大行其道的深度學習在當時仍處于襁褓之中。現(xiàn)在人工智能與機器學習成為人必言之的顯學,蘋果在這方面一直飽受批評。近幾周,TIm Cook終于發(fā)話,表示蘋果并非在人工智能方面沒有著力,僅僅是宣傳較少。現(xiàn)在,高管們終于已改悶聲做事的做法,將蘋果在人工智能方面的成果公之于眾。
機器學習用于Apple Watch的健康應(yīng)用
“蘋果在過去的五年里增長迅猛”,Phil Schiller說,“我們的產(chǎn)品的改進速度也非常快,A系列的處理芯片每年都有不小的性能突破,這使得我們擁有更加充裕的性能,將越來越多的機器學習技術(shù)應(yīng)用到終端產(chǎn)品上。機器學習有不少好東西,而我們也有能力用好它”。
即使蘋果擁抱機器學習的熱情絲毫不亞于任何硅谷科技公司,但他們對于機器學習的使用仍是克制的。這幫庫比提諾的天才們并不認為機器學習是解決一切問題的靈丹妙藥。人工智能是未來的交互方式,但觸摸屏幕,平板電腦,面向?qū)ο缶幊淘谔囟〞r期一樣發(fā)揮了相同的作用。在蘋果看來,機器學習并非其他公司所說,是人機交互的終極答案。“人工智能與以往改變?nèi)藱C交互的各種媒介并無本質(zhì)區(qū)別”,Eddy Cue 說。蘋果對于機器是否將取代人類這樣老生常談的討論也并無興趣。與預(yù)期相同,蘋果并沒有承認造車計劃,也沒有談及自制電視劇的傳言,但蘋果的工程師們明確指出,他們不會造出類似“天網(wǎng)”的東西。
“我們使用技術(shù)來解決以前做不了的事情,已經(jīng)改進舊有范式”,Schiller說,“我們確保每項技術(shù)都能以最蘋果的方式應(yīng)用到產(chǎn)品上”。
之后,他們對于上述觀點展開了進一步的闡釋。如,人工智能在多大程度上重塑了蘋果的生態(tài)系統(tǒng)。蘋果研發(fā)人工智能的初衷是,彌補缺乏搜索引擎帶來的用戶體驗缺失。(搜索引擎能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其快速成熟)此間,高管們再次強調(diào)了蘋果對于保證用戶隱私的決心。(即使這樣將限制用戶數(shù)據(jù)的使用,從而阻礙機器學習的效果)高管們強調(diào),這些障礙并非不可逾越。
這個“大腦”有多大?iPhone上有多少用戶數(shù)據(jù)緩存可供機器學習調(diào)用?工程師們的回答讓我驚訝:“平均200Mb,具體多少取決于用戶信息的多寡。”(為節(jié)約存儲空間,緩存會時不時被清理出去)。這些信息包括了應(yīng)用的使用習慣,與他人的交互,神經(jīng)網(wǎng)絡(luò)處理,還有“自然語言模型”。還有對象識別,人臉識別,場景識別等供神經(jīng)網(wǎng)絡(luò)學習。
對于蘋果來說,這些數(shù)據(jù)都是你的私人信息,并不會被上傳到網(wǎng)絡(luò)及云端。