AI的最終目標是通過從監(jiān)督學(xué)習(xí)過渡到像人類一樣思考
當機器人進入睡眠狀態(tài)時,它會夢到什么?顯然,雅達利游戲。
人的夜間睡眠(或白天打盹)有助于鞏固記憶,將短期記憶轉(zhuǎn)變?yōu)殚L期記憶儲存起來。通過穩(wěn)定、增強以及整合3個不同的過程,你的大腦可將記憶變成更有組織性的文件系統(tǒng),以便于你將來能更輕松地回憶起來。
首先,穩(wěn)定過程可幫助人類在6毫秒內(nèi)將一段記憶編碼。接著,大腦會在數(shù)分鐘、數(shù)小時乃至全天中增強記憶,并將其鞏固為長期記憶。最后就是整合過程,大腦會將新的記憶碎片添加到已有記憶中,這個過程有點兒像整理檔案系統(tǒng),而非整理文件柜。
研究人員希望機器人最終也能像人類這樣。谷歌(微博)旗下子公司DeepMind已經(jīng)在經(jīng)典視頻游戲方面取得巨大成功。《Breakout》、《Asteroids》等游戲不僅教會人工智能(AI)并非為擊敗游戲而簡單排序,而且為今天的監(jiān)督學(xué)習(xí)技術(shù)奠定了基礎(chǔ)。在人類身上,學(xué)會走路之前必須學(xué)會爬。而在機器人身上,你必須首先擊敗游戲,然后才能征服面部檢測或癌癥研究。
盡管DeepMind的技術(shù)正不斷進步,但其依然無法在更復(fù)雜的游戲中擊敗人類,比如《星際爭霸》或《Labyrinth》。當我們?nèi)祟悏舻綄擂蔚那闆r或有威脅問題時,AI夢到的卻是重新排列這些游戲的所有章節(jié),以便于為勝利鋪平道路,并且它們不斷重復(fù)這個過程,直到其成為“專家”。
目標是讓AI能像人類那樣,通過實驗去學(xué)習(xí)。從監(jiān)督學(xué)習(xí)(AI分析數(shù)據(jù)并尋找模式)向非監(jiān)督學(xué)習(xí)轉(zhuǎn)變,包括教授機器人實驗和分析不同的行為過程對結(jié)果的影響。這種學(xué)習(xí)更加耗費時間,因為有無數(shù)變量存在。這為AI處于不活躍周期或做夢時,提供了理想的解決方案。
這依然是AI領(lǐng)域新興的研究領(lǐng)域。但到目前為止,研究人員已經(jīng)報告了令人印象深刻的速度,監(jiān)督學(xué)習(xí)速度增長了10倍。盡管目前還處于試驗狀態(tài),但初步研究結(jié)果顯示,機器人專注于工作場景,至少夢中如此,可能有益于未來的AI進化。