www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 在金庸的小說《射雕英雄傳》里,周伯通“左手畫圓,右手畫方”,左手攻擊右手,右手及時反搏,自娛自樂,終無敵于天下。 現(xiàn)實(shí)世界中,亦有這么一個“幼童&rd

在金庸的小說《射雕英雄傳》里,周伯通“左手畫圓,右手畫方”,左手攻擊右手,右手及時反搏,自娛自樂,終無敵于天下。

現(xiàn)實(shí)世界中,亦有這么一個“幼童”,他沒見過一個棋譜,也沒有得到一個人指點(diǎn),從零開始,自娛自樂,自己參悟,用了僅僅40天,便稱霸圍棋武林。

這個“幼童”,叫阿爾法元(AlphaGo Zero),就是今年5月在烏鎮(zhèn)圍棋峰會上打敗了人類第一高手柯潔的阿爾法狗強(qiáng)化版AlphaGo Master的同門“師弟”。不過,這個遍讀人類幾乎所有棋譜、以3比0打敗人類第一高手的師兄,在“師弟”阿爾法元從零自學(xué)第21天后,便被其擊敗。

10月19日,一手創(chuàng)造了AlphaGo神話的谷歌DeepMind團(tuán)隊(duì)在Nature雜志上發(fā)表重磅論文Mastering the game of Go without human knowledge,介紹了團(tuán)隊(duì)最新研究成果——阿爾法元的出世,引起業(yè)內(nèi)轟動。

雖師出同門,但是師兄弟的看家本領(lǐng)卻有本質(zhì)的差別。

“過去所有版本的AlphaGo都從利用人類數(shù)據(jù)進(jìn)行培訓(xùn)開始,它們被告知人類高手在這個地方怎么下,在另一個地方又怎么下。” DeepMind阿爾法狗項(xiàng)目負(fù)責(zé)人David Silver博士在一段采訪中介紹,“而阿爾法元不使用任何人類數(shù)據(jù),完全是自我學(xué)習(xí),從自我對弈中實(shí)踐。”

David Silver博士介紹,在他們所設(shè)計(jì)的算法中,阿爾法元的對手,或者叫陪練,總是被調(diào)成與其水平一致。“所以它是從最基礎(chǔ)的水平起步,從零開始,從隨機(jī)招式開始,但在學(xué)習(xí)過程中的每一步,它的對手都會正好被校準(zhǔn)為匹配器當(dāng)前水平,一開始,這些對手都非常弱,但是之后漸漸變得越來越強(qiáng)大。”

這種學(xué)習(xí)方式正是當(dāng)今人工智能最熱門的研究領(lǐng)域之一——強(qiáng)化學(xué)習(xí)(Reinforcement learning)。

昆山杜克大學(xué)和美國杜克大學(xué)電子與計(jì)算機(jī)工程學(xué)教授李昕博士向澎湃(新聞)介紹,DeepMind團(tuán)隊(duì)此次所利用的一種新的強(qiáng)化學(xué)習(xí)方式,是從一個對圍棋沒有任何知識的神經(jīng)網(wǎng)絡(luò)開始,然后與一種強(qiáng)大的搜索算法相結(jié)合,“簡單地解釋就是,它開始不知道該怎么做,就去嘗試,嘗試之后,看到了結(jié)果,若是正面結(jié)果,就知道做對了,反之,就知道做錯了,這就是它自我學(xué)習(xí)的方法。”

這一過程中,阿爾法元成為自己的“老師”,神經(jīng)網(wǎng)絡(luò)不斷被調(diào)整更新,以評估預(yù)測下一個落子位置以及輸贏,更新后的神經(jīng)網(wǎng)絡(luò)又與搜索算法重新組合,進(jìn)而創(chuàng)建一個新的、更強(qiáng)大的版本,然而再次重復(fù)這個過程,系統(tǒng)性能經(jīng)過每一次迭代得到提高,使得神經(jīng)網(wǎng)絡(luò)預(yù)測越來越準(zhǔn)確,阿爾法元也越來越強(qiáng)大。

其中值得一提的是,以前版本的阿爾法狗通常使用預(yù)測下一步的“策略網(wǎng)絡(luò)(policy network)”和評估棋局輸贏的“價值網(wǎng)絡(luò)(value network)”兩個神經(jīng)網(wǎng)絡(luò)。而更為強(qiáng)大的阿爾法元只使用了一個神經(jīng)網(wǎng)絡(luò),也就是兩個網(wǎng)絡(luò)的整合版本。

這個意義上而言,“AlphaGo Zero”譯成“阿爾法元”,而不是字面上的“阿爾法零”,“內(nèi)涵更加豐富,代表了人類認(rèn)知的起點(diǎn)——神經(jīng)元。”李昕教授說。

上述研究更新了人們對于機(jī)器學(xué)習(xí)的認(rèn)知。“人們一般認(rèn)為,機(jī)器學(xué)習(xí)就是關(guān)于大數(shù)據(jù)和海量計(jì)算,但是通過阿爾法元,我們發(fā)現(xiàn),其實(shí)算法比所謂計(jì)算或數(shù)據(jù)可用性更重要。”DavidSilver博士說。

李昕教授長期專注于制造業(yè)大數(shù)據(jù)研究,他認(rèn)為,這個研究最有意義的一點(diǎn)在于,證明了人工智能在某些領(lǐng)域,也許可以擺脫對人類經(jīng)驗(yàn)和輔助的依賴。“人工智能的一大難點(diǎn)就是,需要大量人力對數(shù)據(jù)樣本進(jìn)行標(biāo)注,而阿爾法元則證明,人工智能可以通過‘無監(jiān)督數(shù)據(jù)(unsupervised data)’,也就是人類未標(biāo)注的數(shù)據(jù),來解決問題。”

有人暢想,類似的深度強(qiáng)化學(xué)習(xí)算法,或許能更容易地被廣泛應(yīng)用到其他人類缺乏了解或是缺乏大量標(biāo)注數(shù)據(jù)的領(lǐng)域。

不過,究竟有多大實(shí)際意義,能應(yīng)用到哪些現(xiàn)實(shí)領(lǐng)域,李昕教授表示“還前途未卜”,“下圍棋本身是一個比較局限的應(yīng)用,人類覺得下圍棋很復(fù)雜,但是對于機(jī)器來說并不難。而且,下圍棋只是一種娛樂方式,不算作人們在生活中遇到的實(shí)際問題。”

那么,谷歌的AI為什么會選擇圍棋?

據(jù)《第一財(cái)經(jīng)》報(bào)道,歷史上,電腦最早掌握的第一款經(jīng)典游戲是井字游戲,這是1952年一位博士在讀生的研究項(xiàng)目;隨后是1994年電腦程序Chinook成功挑戰(zhàn)西洋跳棋游戲;3年后,IBM深藍(lán)超級計(jì)算機(jī)在國際象棋比賽中戰(zhàn)勝世界冠軍加里?卡斯帕羅夫。

除了棋盤游戲外,IBM的Watson系統(tǒng)在2011年成功挑戰(zhàn)老牌智力競賽節(jié)目Jeopardy游戲一戰(zhàn)成名;2014年,Google自己編寫的算法,學(xué)會了僅需輸入初始像素信息就能玩幾十種Atari游戲。

但有一項(xiàng)游戲仍然是人類代表著頂尖水平,那就是圍棋。

谷歌DeepMind創(chuàng)始人兼CEO Demis Hassabis博士曾在2016年AlphaGo對陣?yán)钍朗瘯r就做過說明,有著3000多年歷史的圍棋是人類有史以來發(fā)明出來的最復(fù)雜的游戲,對于人工智能來說,這是一次最尖端的大挑戰(zhàn),需要直覺和計(jì)算,要想熟練玩圍棋需要將模式識別和運(yùn)籌帷幄結(jié)合。

“圍棋的搜索空間是漫無邊際的——比圍棋棋盤要大1個古戈?duì)?數(shù)量級單位,10的100次方,甚至比宇宙中的原子數(shù)量還要多)。”因此,傳統(tǒng)的人工智能方法也就是“為所有可能的步數(shù)建立搜索樹”,在圍棋游戲中幾乎無法實(shí)現(xiàn)。

而打敗了人類的AlphaGo系統(tǒng)的關(guān)鍵則是,將圍棋巨大無比的搜索空間壓縮到可控的范圍之內(nèi)。David Silver博士此前曾介紹,策略網(wǎng)絡(luò)的作用是預(yù)測下一步,并用來將搜索范圍縮小至最有可能的那些步驟。另一個神經(jīng)網(wǎng)絡(luò)“價值網(wǎng)絡(luò)(valuenetwork)”則是用來減少搜索樹的深度,每走一步估算一次游戲的贏家,而不是搜索所有結(jié)束棋局的途徑。

李昕教授對阿爾法元帶來的突破表示欣喜,但同時他也提到,“阿爾法元證明的只是在下圍棋這個游戲中,無監(jiān)督學(xué)習(xí)(unsupervised learning)比有監(jiān)督學(xué)習(xí)(supervised learning)‘更優(yōu)’,但并未證明這就是‘最優(yōu)’方法,也許兩者結(jié)合的semi-supervised learning,也就是在不同時間和階段,結(jié)合有監(jiān)督或無監(jiān)督學(xué)習(xí)各自的優(yōu)點(diǎn),可以得到更優(yōu)的結(jié)果。”

李昕教授說,人工智能的技術(shù)還遠(yuǎn)沒有達(dá)到人們所想象的程度,“比如,互聯(lián)網(wǎng)登錄時用的reCAPTCHA驗(yàn)證碼(圖像或者文字),就無法通過機(jī)器學(xué)習(xí)算法自動識別”,他說,在某些方面,機(jī)器人確實(shí)比人做得更好,但目前并不能完全替換人。“只有當(dāng)科研證明,一項(xiàng)人工智能技術(shù)能夠解決一些實(shí)際問題和人工痛點(diǎn)時,才真正算作是一個重大突破。”

昆山杜克大學(xué)常務(wù)副校長、中美科技政策和關(guān)系專家丹尼斯·西蒙(Denis Simon)博士在接受澎湃新聞采訪時表示,阿爾法元在圍棋領(lǐng)域的成功說明它確實(shí)有極大的潛力。阿爾法元通過與自身對弈實(shí)現(xiàn)了自身能力的提升,每一次它都變得更聰明,每一次棋局也更有挑戰(zhàn)性。這種重復(fù)性的、充分參與的學(xué)習(xí)增強(qiáng)了阿爾法元處理更高層次的、戰(zhàn)略復(fù)雜問題的能力。但缺點(diǎn)是這是一個封閉的系統(tǒng)。“阿爾法元如何能夠超過自身的局限獲得進(jìn)一步的成長?換句話說,它能跳出框框思考嗎?”

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉