誕生AlphaGo的DeepMind回顧2016年,提出三大發(fā)展方向
谷歌旗下DeepMind團隊本周在官方網(wǎng)站上撰文,回顧了2016年所取得的進展。展望2017年,DeepMind提出了三大發(fā)展方向,包括算法突破、社會影響,以及道德倫理的最佳行為。以下為文章全文:
在當前世界中,無論是天氣還是征服疾病,我們都面臨著非常復(fù)雜、緊急、難于掌握的系統(tǒng)。我們認為,智能程序?qū)⒂兄谕诰蛐碌目茖W知識,給社會帶來幫助。為了實現(xiàn)這一目標,我們需要通用的學習系統(tǒng),從頭開始建立起對問題的理解,并利用這些去識別模式,取得其他方式無法獲得的突破。在DeepMind,這是我們長期研究使命的焦點。
盡管距離我們設(shè)想的智能還有很遠的距離,但2016年是重要的一年。對于多項核心挑戰(zhàn),我們?nèi)〉昧肆钊伺d奮的進展,而我們也首次看到了人工智能對現(xiàn)實世界可能的積極影響。
我們的程序AlphaGo挑戰(zhàn)并擊敗了世界圍棋冠軍李世石,而相關(guān)論文很幸運地讓我們第二次登上了《自然》雜志的封面。許多專家認為,這一成就比預(yù)期中提前了幾十年。對我們以及全球圍棋社區(qū)來說,最令人興奮的是,AlphaGo展示了贏得比賽的創(chuàng)造性,在某些情況下甚至找到了挑戰(zhàn)數(shù)千年圍棋智慧的下法。
對于史上最復(fù)雜的游戲之一,AlphaGo探索并分享了新思路,這表明了人工智能未來某天可能帶來的價值。我們期待2017年能去完成更多游戲。
我們在生成模型領(lǐng)域也取得了有意義的進展,這樣的軟件能自主想象新的結(jié)構(gòu)和場景。在發(fā)表關(guān)于圖像生成的PixelCNN論文之后,我們發(fā)表至WaveNet的論文展示了生成音頻的有效性。我們通過原始的波形合成了全球最近似真人的語音,而不是將語音樣本簡單地拼接在一起。我們計劃與谷歌合作將這項技術(shù)產(chǎn)品化,并且很高興這項技術(shù)能給數(shù)千萬人使用的產(chǎn)品帶來優(yōu)化。
另一個重要研究領(lǐng)域是記憶和存儲,尤其是如何將神經(jīng)網(wǎng)絡(luò)的決策能力與復(fù)雜結(jié)構(gòu)化數(shù)據(jù)的存儲和推理能力結(jié)合在一起。我們憑借“可微分神經(jīng)計算機”在18個月內(nèi)發(fā)表了第三篇《自然》論文。
這種模型能同時像神經(jīng)網(wǎng)絡(luò)一樣學習,以及像計算機一樣記憶數(shù)據(jù)。這樣的模型能學習如何回答關(guān)于數(shù)據(jù)結(jié)構(gòu)的問題,無論是族譜還是地鐵線路圖。這意味著我們更接近利用人工智能通過復(fù)雜數(shù)據(jù)集完成科學發(fā)現(xiàn)的目標。
除了推動這類系統(tǒng)用于更多場合,我們還投入了大量時間,優(yōu)化系統(tǒng)的學習方式。一篇題為“無監(jiān)督輔助任務(wù)的增強學習”論文描述了將某些任務(wù)學習速度提升多個數(shù)量級的方法。考慮到高質(zhì)量訓(xùn)練環(huán)境的重要性,我們向整個社區(qū)開源了旗艦的DeepMind Lab研究環(huán)境。我們也在與暴雪合作,開發(fā)用于《星際爭霸2》的人工智能訓(xùn)練環(huán)境。
當然,這些只是冰山一角。通過我們今年在頂級刊物,例如《Neuron》和《PNAS》,以及主流機器學習會議,例如ICLR和NIPS上發(fā)表的論文,你可以了解到我們的更多工作。我們很高興看到,社區(qū)中的其他參與者正在這些論文成果的基礎(chǔ)上積極部署和開發(fā),例如2016年晚些時候圍棋程序的再次興起,以及人工智能和機器學習在更廣泛的領(lǐng)域快速發(fā)展。
我們也很高興看到,這類工作對現(xiàn)實世界的初步影響。我們與谷歌數(shù)據(jù)中心團隊展開了合作,利用類似AlphaGo的技術(shù)發(fā)現(xiàn)創(chuàng)造性的新方法管理散熱,使樓宇能效大幅提升了15%。
如果這類技術(shù)可以被用于其他大規(guī)模工業(yè)系統(tǒng),那么將很可能給全球環(huán)境和成本帶來幫助。這只是我們與谷歌多支團隊合作,將先進研究用于全球產(chǎn)品和基礎(chǔ)設(shè)施的一個案例。
與此同時,我們也在積極參與與英國兩家NHS(全國醫(yī)療系統(tǒng))醫(yī)院的機器學習研究合作,探索我們的技術(shù)如何帶來更有效的診斷,以及對影響全球數(shù)百萬人的癥狀的治療。
我們還與另兩家醫(yī)院集團就移動應(yīng)用,以及基礎(chǔ)性設(shè)施展開合作,給醫(yī)療帶來優(yōu)化。
當然,這類技術(shù)對社會的積極影響不僅僅是我們正試圖解決的現(xiàn)實世界問題,也包括算法和模型的設(shè)計、訓(xùn)練和部署方式。我們很自豪,能參與創(chuàng)立Partnership on AI項目。
這一項目將領(lǐng)先的研究實驗室、非營利的民間社會團體,以及學術(shù)機構(gòu)聯(lián)合在一起,在算法透明度和安全性等方面制定最佳行為規(guī)范。
通過體驗和信息的多樣化,我們希望能協(xié)助解決這些挑戰(zhàn),找到方法將社會目標置于全球人工智能社區(qū)的中心。
我們?nèi)允且患夷贻p的公司,處于使命的早期。但如果2017年我們可以進一步在這三大領(lǐng)域,包括算法突破、社會影響,以及道德倫理的最佳行為,取得同時的進展,那么將可以更好地對科學社區(qū)和全世界做出貢獻。