神經(jīng)網(wǎng)絡(luò)進(jìn)化能否改變機(jī)器學(xué)習(xí)
掃描二維碼
隨時隨地手機(jī)看文章
神經(jīng)網(wǎng)絡(luò)進(jìn)化通過篩選人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)通路來模擬自然進(jìn)化。神經(jīng)進(jìn)化將進(jìn)化算法和人工神經(jīng)網(wǎng)絡(luò)結(jié)合起來,能像類似于地球上大腦進(jìn)化的方式來訓(xùn)練系統(tǒng)。
許多與機(jī)器學(xué)習(xí)相關(guān)的概念已經(jīng)存在了幾十年。然而,在過去的幾年中,由于計算能力的巨大進(jìn)步,研究人員才得以探索那些已經(jīng)停滯不前的算法和方法。在人工智能領(lǐng)域,有一個概念突然引起了人們的注意:神經(jīng)進(jìn)化。這種方法通過篩選人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)通路來模擬自然進(jìn)化。通過突變,它確定了處理特定任務(wù)最有效的途徑。
在未來幾年,神經(jīng)進(jìn)化通過允許系統(tǒng)更動態(tài)、更智能地進(jìn)行調(diào)整和適應(yīng),可能會影響各種領(lǐng)域,如機(jī)器人、醫(yī)學(xué)和后勤。雖然這個概念的起源可以追溯到20世紀(jì)80年代,但一直到今天,計算能力的發(fā)展才使研究人員能夠給舊算法注入新的活力。
“神經(jīng)進(jìn)化將進(jìn)化算法和人工神經(jīng)網(wǎng)絡(luò)結(jié)合起來。其結(jié)果是得到了一種訓(xùn)練系統(tǒng)的方法,該方法與人類大腦的進(jìn)化方式非常相似?!盪ber人工智能實(shí)驗(yàn)室的高級研究科學(xué)家Kenneth Stanley解釋道。
自然(代碼)選擇神經(jīng)進(jìn)化受自然的啟發(fā)。傳統(tǒng)的深度學(xué)習(xí)使用一種被稱為隨機(jī)梯度下降(SGD)的方法;它通過不斷的訓(xùn)練,逐步減少誤差,從而改進(jìn)算法。盡管SGD在處理許多計算任務(wù)(包括語音和圖像識別等復(fù)雜活動)方面非常有效,但它難以應(yīng)付“強(qiáng)化學(xué)習(xí)”(學(xué)習(xí)如何在很少反饋的情況下學(xué)習(xí))這一更艱巨的挑戰(zhàn)。例如,腿受損或殘廢的機(jī)器人必須學(xué)會一種不同的行走方式,而無需任何人告訴它應(yīng)該如何適應(yīng)這種特殊情況。
人工智能軟件公司SentientTechnologies的研究副總裁、德克薩斯大學(xué)奧斯汀分校(University of Texas at AusTIn)計算機(jī)科學(xué)系教授Risto Miikkulainen解釋說:“通常,神經(jīng)網(wǎng)絡(luò)被用在擁有現(xiàn)有數(shù)據(jù)集的領(lǐng)域。當(dāng)你有現(xiàn)有的數(shù)據(jù)點(diǎn)告訴你如何將輸入映射到輸出時,此時神經(jīng)網(wǎng)絡(luò)是有用的。典型場景包括理解股票市場的行為或天氣狀況的潛在動態(tài),這兩者都會隨著時間的推移顯示出已知的模式。但是,如果您不知道給定輸入的正確輸出是什么,那么您就不能使用這種方法,”Miikkulainen補(bǔ)充道。
神經(jīng)進(jìn)化旨在繞過這一障礙。在過去的幾年中,一些研究人員已經(jīng)涉足了這種方法,包括非盈利研究公司OpenAI、以及DeepMind和Google的團(tuán)隊成員。Uber人工智能實(shí)驗(yàn)室的高級研究科學(xué)家、懷俄明大學(xué)的副教授Stanley和Jeff Clune已經(jīng)證明,神經(jīng)進(jìn)化是一種能夠創(chuàng)建深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大算法,能夠解決強(qiáng)化學(xué)習(xí)問題。他們和Uber人工智能實(shí)驗(yàn)室的團(tuán)隊開發(fā)了一種遺傳算法(GA),訓(xùn)練具有超過400萬參數(shù)的深度卷積網(wǎng)絡(luò)。
機(jī)器突變這項(xiàng)研究已經(jīng)證明了神經(jīng)進(jìn)化的實(shí)際可行性。在Uber人工智能實(shí)驗(yàn)室,Stanley和Clune共同撰寫了五篇關(guān)于這個主題的學(xué)術(shù)論文,他們利用遺傳算法訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),能夠根據(jù)像素數(shù)據(jù)玩Atari視頻游戲。該系統(tǒng)在13場比賽中的6場中表現(xiàn)優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,并避免了一些SGD方法可能出現(xiàn)的一些死循環(huán)。更重要的是,在其中三場比賽中,該系統(tǒng)的表現(xiàn)優(yōu)于人類。
Stanley稱一個關(guān)鍵因素是神經(jīng)網(wǎng)絡(luò)自發(fā)突變的能力。他和克萊恩,以及Uber的另一位研究科學(xué)家Joel Lehman找到了引入“安全”突變的方法,幫助神經(jīng)網(wǎng)絡(luò)顯著增長,并產(chǎn)生更好的結(jié)果。這種技術(shù)使他們能夠進(jìn)化出具有100層以上的深層神經(jīng)網(wǎng)路(DNNs),這遠(yuǎn)遠(yuǎn)超出了以前通過神經(jīng)進(jìn)化所能達(dá)到的程度。
在Uber,該系統(tǒng)的實(shí)際好處可能包括開發(fā)出更好的定價模型或更高效的調(diào)度或路由系統(tǒng)。但這只是神經(jīng)進(jìn)化的魅力之一。遺傳算法,尤其是當(dāng)它與其他機(jī)器學(xué)習(xí)算法結(jié)合在一起時,可以在機(jī)器人、無人機(jī)、自動駕駛汽車、智能城市、藥物設(shè)計和網(wǎng)絡(luò)安全等領(lǐng)域帶來各種各樣的改進(jìn)。不管是對無人機(jī)的結(jié)構(gòu)損壞,還是社區(qū)交通的突然激增,這些系統(tǒng)都能動態(tài)、智能地適應(yīng)變化?!拔覀兊哪繕?biāo)是創(chuàng)建一個框架,可以快速地探索和測試各種可能性,并選擇最佳方法,”Miikkulainen解釋說。
事實(shí)上,Miikkulainen認(rèn)為神經(jīng)進(jìn)化的未來是光明的。它為解決復(fù)雜的計算問題提供了一個潛在的強(qiáng)大工具。包括OpenAI集團(tuán)在內(nèi)的其他公司也在致力于這一領(lǐng)域的研究,并尋找各種可能性。Clune總結(jié)道:“神經(jīng)進(jìn)化一直是一個有趣的概念。現(xiàn)代計算讓研究人員開始真正利用這個想法,就像列奧納多·達(dá)芬奇設(shè)想的直升機(jī),直到很久以后才能真正建造和飛行。”