AI的最終目標(biāo)是通過從監(jiān)督學(xué)習(xí)過渡到像人類一樣思考

時(shí)間：2020-08-19 11:42:01

關(guān)鍵字： AI 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　當(dāng)機(jī)器人進(jìn)入睡眠狀態(tài)時(shí)，它會夢到什么?顯然，雅達(dá)利游戲。　　人的夜間睡眠(或白天打盹)有助于鞏固記憶，將短期記憶轉(zhuǎn)變?yōu)殚L期記憶儲存起來。通過穩(wěn)定、增強(qiáng)以及整合3個(gè)不同的過程，你的大

　　當(dāng)機(jī)器人進(jìn)入睡眠狀態(tài)時(shí)，它會夢到什么?顯然，雅達(dá)利游戲。

　　人的夜間睡眠(或白天打盹)有助于鞏固記憶，將短期記憶轉(zhuǎn)變?yōu)殚L期記憶儲存起來。通過穩(wěn)定、增強(qiáng)以及整合3個(gè)不同的過程，你的大腦可將記憶變成更有組織性的文件系統(tǒng)，以便于你將來能更輕松地回憶起來。

　　首先，穩(wěn)定過程可幫助人類在6毫秒內(nèi)將一段記憶編碼。接著，大腦會在數(shù)分鐘、數(shù)小時(shí)乃至全天中增強(qiáng)記憶，并將其鞏固為長期記憶。最后就是整合過程，大腦會將新的記憶碎片添加到已有記憶中，這個(gè)過程有點(diǎn)兒像整理檔案系統(tǒng)，而非整理文件柜。

　　研究人員希望機(jī)器人最終也能像人類這樣。谷歌(微博)旗下子公司DeepMind已經(jīng)在經(jīng)典視頻游戲方面取得巨大成功?！禕reakout》、《Asteroids》等游戲不僅教會人工智能(AI)并非為擊敗游戲而簡單排序，而且為今天的監(jiān)督學(xué)習(xí)技術(shù)奠定了基礎(chǔ)。在人類身上，學(xué)會走路之前必須學(xué)會爬。而在機(jī)器人身上，你必須首先擊敗游戲，然后才能征服面部檢測或癌癥研究。

　　盡管DeepMind的技術(shù)正不斷進(jìn)步，但其依然無法在更復(fù)雜的游戲中擊敗人類，比如《星際爭霸》或《Labyrinth》。當(dāng)我們?nèi)祟悏舻綄擂蔚那闆r或有威脅問題時(shí)，AI夢到的卻是重新排列這些游戲的所有章節(jié)，以便于為勝利鋪平道路，并且它們不斷重復(fù)這個(gè)過程，直到其成為“專家”。

　　目標(biāo)是讓AI能像人類那樣，通過實(shí)驗(yàn)去學(xué)習(xí)。從監(jiān)督學(xué)習(xí)(AI分析數(shù)據(jù)并尋找模式)向非監(jiān)督學(xué)習(xí)轉(zhuǎn)變，包括教授機(jī)器人實(shí)驗(yàn)和分析不同的行為過程對結(jié)果的影響。這種學(xué)習(xí)更加耗費(fèi)時(shí)間，因?yàn)橛袩o數(shù)變量存在。這為AI處于不活躍周期或做夢時(shí)，提供了理想的解決方案。

　　這依然是AI領(lǐng)域新興的研究領(lǐng)域。但到目前為止，研究人員已經(jīng)報(bào)告了令人印象深刻的速度，監(jiān)督學(xué)習(xí)速度增長了10倍。盡管目前還處于試驗(yàn)狀態(tài)，但初步研究結(jié)果顯示，機(jī)器人專注于工作場景，至少夢中如此，可能有益于未來的AI進(jìn)化。