人工神經(jīng)網(wǎng)絡(luò)在這六大領(lǐng)域的表現(xiàn)已經(jīng)超越了人類
五年前,研究人員在能夠解讀圖像的軟件的準(zhǔn)確性上有了一次突如其來但大幅度的飛躍,其背后的人工神經(jīng)網(wǎng)絡(luò)支撐了我們現(xiàn)在在人工智能行業(yè)所看到的繁榮景象。然而,我們?nèi)赃h(yuǎn)未達(dá)到《終結(jié)者》或《黑客帝國》中所描述的那種現(xiàn)實。
目前,研究人員正試圖把重點放在怎樣教機器把一件事做到極致。與人腦同時處理多個事物的大腦不同,機器人必須以線性的方式“思考”。無論如何,在某些領(lǐng)域,人工智能已經(jīng)打敗了人類。深度神經(jīng)網(wǎng)絡(luò)已經(jīng)學(xué)會了交談、駕駛汽車、玩電子游戲、下圍棋、畫畫,以及幫助探索科學(xué)發(fā)現(xiàn)。
在以下六個領(lǐng)域中,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)證明,它們可以超越人類智能。
1.圖像和物體識別
記錄表明,機器在圖像和物體識別方面的能力遠(yuǎn)遠(yuǎn)超過了人類。在一次測試軟件識別玩具的能力的實驗中,Geoff Hinton發(fā)明的Capsule網(wǎng)絡(luò)的錯誤率幾乎只有之前最低錯誤率的一半。在不同的掃描過程中,增加這些膠囊的數(shù)量可以讓系統(tǒng)更好地識別一個物體,即使這個視圖與之前分析的不同。
另一個例子來自于一個最先進(jìn)的網(wǎng)絡(luò),它是在一個有標(biāo)簽的圖片數(shù)據(jù)庫上訓(xùn)練的,并且能夠比一個博士生更好地對物體進(jìn)行分類,而這些博士生在相同的任務(wù)上接受了超過100個小時的訓(xùn)練。
2.電子游戲谷歌的DeepMind使用一種被稱為“深度強化學(xué)習(xí)”的深度學(xué)習(xí)技術(shù),研究人員用這種方法教電腦玩雅達(dá)利的打磚塊游戲Breakout。他們沒有以任何特定的方式對這臺電腦進(jìn)行教學(xué)或編程。相反,它在看分?jǐn)?shù)的同時還控制了鍵盤,它的目標(biāo)是得到盡可能高的分?jǐn)?shù)。玩了兩個小時后,電腦就成為了這個游戲的專家。
深度學(xué)習(xí)社區(qū)正在進(jìn)行一場競賽,訓(xùn)練計算機在幾乎所有你能想到的游戲中擊敗人類,包括太空入侵者、末日、Pong和魔獸世界。在大多數(shù)游戲中,深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)勝過有經(jīng)驗的玩家。電腦并不是通過編程來玩游戲的,他們只是通過玩游戲來學(xué)習(xí)。
3.語音生成和識別去年,谷歌發(fā)布了WaveNet,百度發(fā)布了Deep Speech。兩者都是深度學(xué)習(xí)網(wǎng)絡(luò),能自動生成語音。這些系統(tǒng)學(xué)會了模仿人類的聲音,并且它們的水平隨著時間的推移不斷提高。將他們的演講與真實的人區(qū)別開來,要比人們想象的要難得多。
牛津大學(xué)和谷歌公司DeepMind的科學(xué)家們創(chuàng)造了一個深度網(wǎng)絡(luò),LipNet,在閱讀人們的唇語上達(dá)到了93%的正確率,而普通的人類唇語閱讀者只能達(dá)到52%的正確率。來自華盛頓大學(xué)的一個小組利用唇形同步創(chuàng)建了一個系統(tǒng),將合成音頻與現(xiàn)有視頻實現(xiàn)同步。
4.藝術(shù)品和風(fēng)格的模仿神經(jīng)網(wǎng)絡(luò)可以研究某一特定藝術(shù)作品的筆觸、顏色和陰影的圖案。在此基礎(chǔ)上,它可以根據(jù)分析將原始的藝術(shù)作品轉(zhuǎn)化為新的圖像。
DeepArt.io就是一個例子,這家公司開發(fā)的應(yīng)用可以使用深度學(xué)習(xí)來學(xué)習(xí)數(shù)百種不同的風(fēng)格,你可以將它們應(yīng)用到你的照片中。藝術(shù)家和程序員Gene Kogan也運用了風(fēng)格轉(zhuǎn)換,基于算法從埃及象形文字中學(xué)習(xí)的風(fēng)格來修改蒙娜麗莎畫像。
5.預(yù)測斯坦福大學(xué)的研究人員TImnit Gebru選取了5000萬張谷歌街景圖片,探索一個深度學(xué)習(xí)網(wǎng)絡(luò)可以做些什么。結(jié)果是,計算機學(xué)會了定位和識別汽車。它檢測到超過2200萬輛汽車,包括它們的制造、型號、體型和年份。這一系統(tǒng)獲得的洞見之一就是,選民隊伍的起點和終點在哪里。根據(jù)這一分析,“如果在15分鐘車程中遇到的轎車數(shù)量高于皮卡車的數(shù)量,那么這座城市可能會在下次總統(tǒng)選舉中投票給民主黨人(88%的幾率),”TImnit Gebru和他的合著者寫道。
另一個機器提供比人類更準(zhǔn)確的預(yù)測的例子來自谷歌的Sunproof項目,這項技術(shù)使用了來自谷歌地球的航拍照片來創(chuàng)建一個你的屋頂?shù)?D模型,將它與周圍的樹木和陰影區(qū)分開。然后,它利用太陽的軌跡,根據(jù)位置參數(shù)來預(yù)測你屋頂?shù)奶柲茈姵匕迥墚a(chǎn)生多少能量。
6.網(wǎng)站設(shè)計修改在網(wǎng)站生成器中集成的人工智能可以幫助網(wǎng)站更新,并對網(wǎng)站進(jìn)行有用的修改,比人類更快速、更準(zhǔn)確。這種系統(tǒng)的基本技術(shù)提供了關(guān)于網(wǎng)站外觀的普通用戶的意見,這可以告訴設(shè)計師網(wǎng)站設(shè)計的好壞。如今,網(wǎng)站建設(shè)者們要么利用深層網(wǎng)絡(luò)來修改設(shè)計,要么計劃在不久的將來使用它們。該技術(shù)可以分析不同的模式,并根據(jù)以前的轉(zhuǎn)化率和其他重要指標(biāo),創(chuàng)造更好的結(jié)果。
雖然我們距離實現(xiàn)矩陣級別的人工智能還差得很遠(yuǎn),但企業(yè)正在努力快速提高神經(jīng)網(wǎng)絡(luò)的智能化水平。上面提到的項目只是這項技術(shù)的淺層次應(yīng)用,新的想法和改進(jìn)不斷涌現(xiàn),證明機器在完成任務(wù)方面正在不斷超越人類的表現(xiàn)。