當(dāng)前位置：首頁 > 智能硬件 > 機(jī)器人

谷歌AI最新成果——投擲機(jī)器人 TossingBot

時(shí)間：2020-06-08 23:42:01

關(guān)鍵字：人工智能機(jī)器人谷歌

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 昨日，谷歌 AI 在博客介紹了最新成果——投擲機(jī)器人 TossingBot，一個(gè)能夠在真實(shí)、隨機(jī)的世界里學(xué)會(huì)抓取物體，并扔至習(xí)慣范圍外指定位置的拾取機(jī)器人。 AI 科技評(píng)論將之編譯如下。

昨日，谷歌 AI 在博客介紹了最新成果——投擲機(jī)器人 TossingBot，一個(gè)能夠在真實(shí)、隨機(jī)的世界里學(xué)會(huì)抓取物體，并扔至習(xí)慣范圍外指定位置的拾取機(jī)器人。 AI 科技評(píng)論將之編譯如下。

盡管已在物體抓取、視覺自適應(yīng)、從現(xiàn)實(shí)經(jīng)驗(yàn)學(xué)習(xí)方面取得相當(dāng)大的進(jìn)步，然而我們依舊要考慮機(jī)器人如何執(zhí)行抓取、處理以及物體置放等任務(wù)的——尤其在無規(guī)律的環(huán)境設(shè)置里。讓我們觀察這個(gè)在亞馬遜機(jī)器人挑戰(zhàn)賽的裝載任務(wù)中取得第一名的機(jī)器人：

這是一個(gè)令人印象深刻的系統(tǒng)，擁有許多從運(yùn)動(dòng)學(xué)角度上來說可以防止由于不可預(yù)見動(dòng)力而導(dǎo)致物體掉落的設(shè)計(jì)功能：從穩(wěn)定、從容的動(dòng)作軌跡，到限制物體動(dòng)量的機(jī)械夾子，無一不在保證該功能的實(shí)現(xiàn)。

與其他機(jī)器人一樣，在最開始設(shè)計(jì)時(shí)，它便旨在適應(yīng)無規(guī)律世界的動(dòng)力因素。這里有一個(gè)問題是，除了單純地適應(yīng)動(dòng)力因素，難道機(jī)器人就不能夠?qū)W會(huì)有效使用它們，開發(fā)物理層面的「直覺」，從而能夠更有效地完成指定任務(wù)？這樣做的話也許可以有效提高機(jī)器人的行動(dòng)能力，進(jìn)而掌握更復(fù)雜的運(yùn)動(dòng)技能，比如扔?xùn)|西、滑動(dòng)、旋轉(zhuǎn)、擺動(dòng)或者是捕捉等，這將能帶來許多有潛力的應(yīng)用，比如災(zāi)難場(chǎng)景中高效作業(yè)的碎片清理機(jī)器人——在這種場(chǎng)景中往往爭分奪秒。

為了進(jìn)一步探索這個(gè)概念，我們與來自普林斯頓大學(xué)、哥倫比亞大學(xué)以及麻省理工學(xué)院的研究員們合作開發(fā)出了 TossingBot：一個(gè)能夠在真實(shí)、隨機(jī)的世界里學(xué)會(huì)抓取物體，并扔至習(xí)慣范圍外指定位置的拾取機(jī)器人。通過學(xué)習(xí)拋出，TossingBot 得以實(shí)現(xiàn)兩倍于過往系統(tǒng)的拾取速度，并達(dá)到兩倍的有效置放范圍。TossingBot 利用從視覺觀察（RGB-D 圖像）映射至運(yùn)動(dòng)圖元控制參數(shù)的端到端神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)抓取與投擲策略。通過高架攝像頭追蹤物體落地位置，TossingBot 得以借助自我監(jiān)督機(jī)制逐步自我完善。

面臨挑戰(zhàn)

投擲是一項(xiàng)難度特別高的任務(wù)，主要取決于多種因素：從物體被拾取的方式（即“投擲前條件”），到物體的物理屬性（如質(zhì)量、摩擦力、空氣動(dòng)力學(xué)等）。打個(gè)比方，如果你以靠近質(zhì)心的把手位置來抓住一把螺絲刀并扔掉，其著陸位置會(huì)比你從金屬尖端抓住并拋出更靠近你，后者的話，它將向前擺動(dòng)后落在離你較遠(yuǎn)的位置。需要強(qiáng)調(diào)的是，無論是何種拾取方式，拋擲一把螺絲刀與拋擲一個(gè)乒乓球，兩者之間有很大的不同，乒乓球?qū)⒁蚩諝庾枇β湓诟拷愕奈恢?。如果要靠手?dòng)去設(shè)計(jì)一個(gè)能夠妥當(dāng)處理隨機(jī)對(duì)象涉及這些因素的解決方案，幾乎是不可能的。

投擲取決于多重因素：從如何撿起它到物體的屬性與動(dòng)態(tài)

借助深度學(xué)習(xí)，我們的機(jī)器人得以從經(jīng)驗(yàn)中學(xué)習(xí)，不用依賴手動(dòng)式的逐案工程。過去我們已證明我們的機(jī)器人能夠?qū)W習(xí)如何推動(dòng)與抓住各種物體，然而要想準(zhǔn)確投擲物體，需要我們對(duì)射彈物理學(xué)有深入的了解。僅僅通過反復(fù)試驗(yàn)試圖獲取這些知識(shí)，不僅耗時(shí)耗錢，而且往往無法勝任那些不夠具體、且未仔細(xì)進(jìn)行訓(xùn)練方案設(shè)置的任務(wù)。

物理和深度學(xué)習(xí)的結(jié)合

TossingBot 通過整合基礎(chǔ)物理學(xué)與深度學(xué)習(xí)來學(xué)習(xí)投擲，使之能夠快速被訓(xùn)練，并推廣至新場(chǎng)景中進(jìn)行運(yùn)用。物理學(xué)提供關(guān)于世界如何運(yùn)作的先驗(yàn)?zāi)Ｐ?，我們可以運(yùn)用該模型來開發(fā)機(jī)器人的初始控制器。比如在投擲場(chǎng)景里，我們可以利用彈道學(xué)原理幫助我們估計(jì)使物體落至目標(biāo)位置所需的投擲速度。接著利用神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)基于物理估算的調(diào)整，以隨時(shí)應(yīng)對(duì)可能出現(xiàn)的未知?jiǎng)討B(tài)，例如現(xiàn)實(shí)世界中的噪聲與變化。我們將這種混合方案稱為殘留物理學(xué)，它使 TossingBot 達(dá)到 85％的投擲精度。

訓(xùn)練一開始，伴隨著初始權(quán)重隨機(jī)化， TossingBot 反復(fù)嘗試不那么精確的抓取行為。隨著時(shí)間的推移，TossingBot 逐漸學(xué)會(huì)以更好的方式來抓取物體，并在同一時(shí)間提高其投擲水平。在這過程中，機(jī)器人會(huì)偶爾以過去未曾嘗試過的速度投擲物體，來探索隨后會(huì)發(fā)生些什么。當(dāng)垃圾箱被清空時(shí)，TossingBot 會(huì)主動(dòng)抬起盒子以便讓物體滑落回垃圾箱里。通過這種方式，訓(xùn)練期間的人為干預(yù)被降到最低。通過10，000 次左右的抓握與投擲嘗試（或等同于 14 小時(shí)的訓(xùn)練時(shí)間），它最終實(shí)現(xiàn) 85％的投擲準(zhǔn)確度，在雜亂環(huán)境中的抓取可靠性為 87％。

推廣至新場(chǎng)景

通過對(duì)物理與深度學(xué)習(xí)進(jìn)行整合，TossingBot 能夠快速適應(yīng)未出現(xiàn)過的投擲位置與物體。打個(gè)比方，當(dāng)我們利用形狀簡單的物體（如木塊、球和馬克筆）對(duì)之進(jìn)行訓(xùn)練，隨后它便可以很好應(yīng)對(duì)塑料水果、裝飾物品和辦公物品等新物體。在新物體的抓取 & 投擲任務(wù)上，TossingBot 剛開始的表現(xiàn)可能比較一般，然而在經(jīng)過幾百個(gè)訓(xùn)練步驟（一或兩小時(shí)）的淬煉后，它可以快速適應(yīng)并實(shí)現(xiàn)與訓(xùn)練物體同等的性能表現(xiàn)。我們發(fā)現(xiàn)，將物理學(xué)、深度學(xué)習(xí)與殘差物理結(jié)合，可以達(dá)到比基線方案更好的性能。我們甚至親自上手操作這個(gè)任務(wù)，驚喜地發(fā)現(xiàn) TossingBot 的表現(xiàn)比我們當(dāng)中任何一名工程師還要精準(zhǔn)！即便如此，我們尚未將之與那些具有運(yùn)動(dòng)天賦的人進(jìn)行測(cè)試對(duì)比。

TossingBot 能力可以輕易被推廣至新物體上，且表現(xiàn)比普通的 Google 員工要更準(zhǔn)確

我們還測(cè)試了一種可以推廣至過去在訓(xùn)練過程中未曾出現(xiàn)過的新目標(biāo)位置的對(duì)策。為此，我們先將模型放在一組箱子上進(jìn)行訓(xùn)練，接著再選擇另一組擁有截然不同著陸區(qū)域的箱子上進(jìn)行測(cè)試。在這種情況下，我們發(fā)現(xiàn)投擲背后的殘差物理理論作用很明顯，彈道學(xué)對(duì)投擲速度的初始估計(jì)能夠幫助我們推導(dǎo)出新的目標(biāo)位置，而殘差理論可以在這些估計(jì)的基礎(chǔ)上進(jìn)行調(diào)整，以應(yīng)對(duì)不同物體屬性在現(xiàn)實(shí)世界中的變化。這與僅僅使用深度學(xué)習(xí)的基線方法形成了強(qiáng)烈對(duì)比，后者只能處理訓(xùn)練期間看到的目標(biāo)位置。

TossingBot 基于殘差物理理論將物體扔到不可預(yù)見的位置

基于互動(dòng)的語義擴(kuò)充

為了解 TossingBot 的學(xué)習(xí)內(nèi)容，我們?cè)谙渲蟹胖脦追N物體，在捕獲圖像后，將之輸入至 TossingBot 的訓(xùn)練神經(jīng)網(wǎng)絡(luò)中，以提取中間像素的深層特征。我們基于相似性對(duì)特征進(jìn)行聚類，并將最近鄰居可視化為熱圖（越熱的區(qū)域表示該特征空間擁有越多的相似性），這樣便可以準(zhǔn)確定位在該場(chǎng)景中的所有乒乓球。即使橙色墻塊與乒乓球有著相似的顏色，然而其特征已經(jīng)足以讓 TossingBot 作出區(qū)分。同理，我們也可以利用提取特征來定位所有的馬克筆，即便這些馬克筆擁有相似的形狀與重量，且在顏色上不盡相同。觀察結(jié)果表明，TossingBot 可能更多依賴幾何線索（如形狀）來學(xué)習(xí)抓握與投擲行為。此外，學(xué)習(xí)到的特征也可能反映了進(jìn)階屬性（如物理屬性），這些屬性決定了該物體應(yīng)該如何被拋出。

在未有明確監(jiān)督情況下，TossingBot 習(xí)得了區(qū)分物體類別的深層特征。

這些新興功能是在除了任務(wù)級(jí)別的抓取和投擲任務(wù)外，在沒有任何明確監(jiān)督的情況下從頭開始學(xué)習(xí)的。它似乎已經(jīng)足以使系統(tǒng)對(duì)物體類別進(jìn)行區(qū)分（比如之前提到的乒乓球和馬克筆）。這個(gè)實(shí)驗(yàn)說明一個(gè)與機(jī)器視覺相關(guān)的廣泛概念：機(jī)器人應(yīng)該如何學(xué)習(xí)視覺世界的語義？從經(jīng)典計(jì)算機(jī)視覺的角度來看，語義通常是通過人工圖像數(shù)據(jù)集與人工構(gòu)建的類別區(qū)分來預(yù)先進(jìn)行定義的。然而我們的實(shí)驗(yàn)結(jié)果表明，只要對(duì)手頭的任務(wù)來說是重要的，模型就能從物理交互中隱含習(xí)得物體級(jí)別的語義。這些交互越復(fù)雜，語義的分辨率就越高。對(duì)于通用智能機(jī)器人來說——也許它們通過交互來發(fā)展自己的語義概念就已足夠，而無需人為的干預(yù)。

局限性與工作展望

盡管 TossingBot 的實(shí)驗(yàn)結(jié)果看起來充滿希望，然而卻依然存在其局限性。例如，它假設(shè)所有物體都足以承受拋擲后的著陸碰撞——這就需要進(jìn)一步的工作來學(xué)習(xí)針對(duì)易碎物體的投擲行為，或者訓(xùn)練其他機(jī)器人以緩沖著陸的方式來抓取物體。此外，TossingBot 只能憑視覺數(shù)據(jù)來推斷控制參數(shù)—— 而探索額外的感覺（如力矩或觸覺）實(shí)際上可以使系統(tǒng)更好地對(duì)新物體作出反應(yīng)。

物理學(xué)和深度學(xué)習(xí)的結(jié)合，將 TossingBot 導(dǎo)向一個(gè)有趣的問題：還有哪些領(lǐng)域可以從殘差物理學(xué)中受益？如何將這個(gè)想法推導(dǎo)至其他類型的任務(wù)與交互，是未來研究里一個(gè)充滿希望的方向。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場(chǎng)，使汽車開發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場(chǎng)開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競(jìng)爭力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競(jìng)爭優(yōu)勢(shì)...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡稱"軟通動(dòng)力"）與長三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)