www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 過去十幾年,人類可以說是在機(jī)器智能面前節(jié)節(jié)退敗,屢敗屢戰(zhàn)。而多任務(wù)處理(multi-tasking),幾乎是為數(shù)不多可以讓我們“天生驕傲”的能力了。 比如,人可以同時打開8個網(wǎng)站、3份文

過去十幾年,人類可以說是在機(jī)器智能面前節(jié)節(jié)退敗,屢敗屢戰(zhàn)。而多任務(wù)處理(multi-tasking),幾乎是為數(shù)不多可以讓我們“天生驕傲”的能力了。

比如,人可以同時打開8個網(wǎng)站、3份文檔和一個Facebook,即使正在專心處理其中一件事,只要突然收到一條回復(fù)或更新提醒,也能夠快速安排的明明白白。

對機(jī)器而言,要在同一時間完成這樣的任務(wù)顯然有點難。因此,多任務(wù)處理一直被視作是人類所獨有的的技能點。

然而,這個優(yōu)勢似乎也快要失守了。

Deepmind一項最新的研究成果顯示,借助其開發(fā)的PopArt方法來訓(xùn)練深度學(xué)習(xí)引擎,能夠培養(yǎng)出可進(jìn)行多任務(wù)處理的智能體,并且在實際的表現(xiàn)中超越了人類!

讓機(jī)器“一心多用”的PopArt,究竟是如何工作的?

關(guān)于多任務(wù)學(xué)習(xí)的研究已經(jīng)持續(xù)了大概20年之久,盡管一直沒能像單任務(wù)學(xué)習(xí)(如AlphaGo)那樣做出什么奪人眼球的成果,但顯然更符合我們對“機(jī)器模擬人腦”的想象。

畢竟在現(xiàn)實生活中,各種“學(xué)習(xí)任務(wù)”之間都有著千絲萬縷的聯(lián)系,比如當(dāng)人在玩電子游戲時,圖像識別、任務(wù)理解、執(zhí)行操作并追求收益最大化,這些都可以在瞬間完成的操作,并且在任何一個游戲中都可以如法炮制,而機(jī)器目前只能通過分解成單個任務(wù)去學(xué)習(xí)并處理。

怎樣指導(dǎo)機(jī)器在同一時間完成多個復(fù)雜任務(wù),Deepmind提出了一個新的方法“PopArt”,據(jù)說可以讓機(jī)器在多任務(wù)處理上的成績超越人類。

如名字所示,PopArt(Preserving Outputs Precisely while AdapTIvely Rescaling Targets),即在自適應(yīng)重新縮放目標(biāo)的同時精確保留原有輸出。

有人可能會說,這句話里每個漢字我都認(rèn)識,但湊在一起竟然完全不知道說的是啥?

不要方,我們今天就來“庖丁解?!?,告訴大家這個能夠讓機(jī)器“一心多用”的PopArt,究竟是何方神圣?

簡單來說,PopArt的工作機(jī)制就是在機(jī)器對不同任務(wù)的學(xué)習(xí)數(shù)據(jù)進(jìn)行加權(quán)之前,先對數(shù)據(jù)目標(biāo)進(jìn)行自動的“歸一化”調(diào)整,再將其轉(zhuǎn)換成原始數(shù)據(jù)輸出給機(jī)器。

這一做法有兩個好處:

一是讓機(jī)器對不同獎勵大小和頻率的多個任務(wù)進(jìn)行更穩(wěn)健、一致的學(xué)習(xí)。

對于機(jī)器而言,多任務(wù)學(xué)習(xí)比單一任務(wù)學(xué)習(xí)更困難的最主要原因就是,多任務(wù)學(xué)習(xí)必須要將有限的資源分配給多個任務(wù)目標(biāo),但常規(guī)算法對不同任務(wù)設(shè)置的權(quán)重也有所不同。這就導(dǎo)致機(jī)器智能體會根據(jù)任務(wù)回報的多寡來選擇執(zhí)行哪些任務(wù)。

舉個例子,同樣是A游戲,機(jī)器在處理《pong》(一款乒乓球游戲)時只能得到-1、0或+1的獎勵,而處理《吃豆人小姐》游戲時,則可以獲得上千個積分,機(jī)器自然會更專注于執(zhí)行后者。

即使開發(fā)者將單個獎勵設(shè)置成一樣的,隨著不同游戲獎勵頻率的不同,差距還是會越來越大,依然會影響機(jī)器的判斷。

結(jié)果就是,這個智能體會在處理某些任務(wù)上表現(xiàn)越來越好,但在其他任務(wù)上卻越來越力不從心。

但PopArt可以很好地解決這個機(jī)器“偏心”的問題。

DeepMind將PopArt應(yīng)用在自己最常用的深度強(qiáng)化學(xué)習(xí)智能體IMPALA上,讓它同時處理57個Atari經(jīng)典游戲,結(jié)果令人震驚——

應(yīng)用了PopArt的IMPALA,不僅分?jǐn)?shù)遠(yuǎn)遠(yuǎn)高于原始IMPALA的表現(xiàn),甚至超越了人類的成績!

下圖中可以看到,修正游戲數(shù)據(jù)權(quán)重后的IMPALA(藍(lán)色)性能表現(xiàn)接近于0%,與PopArt-IMPALA中位數(shù)101%的華麗數(shù)據(jù)形成了鮮明對比。

簡單來說,就是PopArt自適應(yīng)調(diào)整了每個游戲中獎勵分支的大小,讓機(jī)器認(rèn)為不同任務(wù)帶給自己的獎勵是相同的,擁有同等的學(xué)習(xí)價值,因此,盡管這57個游戲有著巨量的環(huán)境、不一樣的動態(tài)和完全不同的獎勵機(jī)制,但機(jī)器都能夠?qū)λ鼈儭耙灰曂省薄?/p>

據(jù)我們所知,這還是當(dāng)前單個智能體首次超越人類在多任務(wù)處理上的表現(xiàn)。

PopArt的第二重作用,則是能夠有效增加機(jī)器學(xué)習(xí)智能體的數(shù)據(jù)效率,降低訓(xùn)練成本。

Deepmind發(fā)現(xiàn),PopArt-IMPALA與像素控制技術(shù)相結(jié)合,只需要不到十分之一的數(shù)據(jù)量,就能達(dá)到原來的訓(xùn)練效果,這使其數(shù)據(jù)效率大幅提升。

因此,PopArt-IMPALA在大型多任務(wù)訓(xùn)練任務(wù)中,不僅比專家智能體DQN性能更高,而且更加便宜。

如果將訓(xùn)練任務(wù)放到云端,PopArt-IMPALA的性能只用了2.5天就超過了DQN,GPU占用空間更小,直接促使訓(xùn)練成本大幅降低。

Deepmind和OpenAI,技術(shù)大佬為何都對“多任務(wù)學(xué)習(xí)”情有獨鐘?

除了PopArt,今年早期,Deepmind還提出了另一種用于多任務(wù)訓(xùn)練的新方法——Distral,通過捕捉不同任務(wù)之間的共同行為或特征,讓機(jī)器算法可以在被限制的條件下實現(xiàn)任務(wù)共享,從而進(jìn)行同步強(qiáng)化學(xué)習(xí)。

和Deepmind一樣跟“多任務(wù)學(xué)習(xí)”死磕的還有OpenAI,則是利用迭代擴(kuò)增方法,不給機(jī)器學(xué)習(xí)模型提供完整的標(biāo)注數(shù)據(jù),而是將每一項任務(wù)分解成小的子任務(wù),再為子任務(wù)提供訓(xùn)練信號,訓(xùn)練AI去完成復(fù)雜任務(wù)。

此外,MIT、Apple等頂尖技術(shù)玩家都在搗鼓這項技術(shù),然而如果你把這當(dāng)做一個技術(shù)領(lǐng)域的“榮譽保衛(wèi)戰(zhàn)”或者論文制造機(jī),那就大錯特錯了。

隨著AI的泛在化越來越強(qiáng),有越來越多的領(lǐng)域都亟待“多任務(wù)學(xué)習(xí)”能力來提供新的解決方案。

這意味著,人類不需要針對每一項任務(wù)都從頭開始訓(xùn)練一個全新的智能體,而是可以構(gòu)建一個通用的智能體,來支持多個應(yīng)用之間的協(xié)同工作。

比如小到一臺電視,很多AI電視都整合了眾多功能,比如觀看視頻、天氣預(yù)報、事務(wù)提醒、網(wǎng)絡(luò)購物等等,如何在既不影響用戶看視頻,又能夠用語音喚醒其他功能?這就要依靠多任務(wù)并行處理。換句話說,不具備多任務(wù)學(xué)習(xí)能力的AI電視,有的只是一個“假腦子”。

大到一個城市。在眾多關(guān)于智慧城市的假想中,都少不了這樣一個場面:城市大腦將人、車、路數(shù)據(jù)都接入系統(tǒng),生成一個交通實時大試圖,并以此完成交通系統(tǒng)的智能調(diào)度和管理,治療“交通病”。這意味著,城市大腦需要進(jìn)行攝像頭識別、城市空間布局和設(shè)施配置、事件預(yù)警、政務(wù)服務(wù)等多個系統(tǒng)的學(xué)習(xí),能夠發(fā)掘出這些子系統(tǒng)之間的關(guān)系,又能區(qū)分這些任務(wù)之間的差別。缺了任何一環(huán),都有可能導(dǎo)致這個城市大腦做出“奇葩”的決策。

當(dāng)然,對于研究者來說,在用每一點進(jìn)步無限逼近人類心智的“珠穆朗瑪峰”。但對產(chǎn)業(yè)而言,任何新技術(shù)的落地都從來容不得一絲任性,因為每一顆種子都在等待豐收。

為了滿足這個前提,就意味著所采取的方法不能以無限制地增加GPU容量和訓(xùn)練強(qiáng)度為代價。因為沒有企業(yè)或者機(jī)構(gòu)愿意以一種不計成本的方式上馬AI,即便這個AI能夠處理多線程任務(wù),那還不如“單任務(wù)AI+人工”來的更加現(xiàn)實。

目前看來,成本更低的PopArt大有可為。

說了這么多,回到最開始的問題,AI的多任務(wù)處理能力真的超越人類了嗎?

從苛刻的實驗室數(shù)字角度講,是的。但從廣泛定義的智慧角度看,機(jī)器的每一點進(jìn)步都還依賴于不斷模擬和接近人腦的水平,距離否定人類本身的價值,還早著呢。

目前看來,處理多任務(wù)的學(xué)習(xí)能力更大的作用,還是提升AI在產(chǎn)業(yè)應(yīng)用上的工程能力,用更高的智能為生活帶來便利。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉