軟體機器人能夠延展和操控自己形狀 擁有傳統(tǒng)機器人沒有的優(yōu)勢
軟體機器人屬于一個新的領(lǐng)域,它可能在諸如外科手術(shù)等領(lǐng)域發(fā)揮重要作用(手術(shù)時的納米機器人需要在人體內(nèi)部移動而不損傷軟組織)。軟體機器人通常由彈性、高柔韌性甚至有機材料制成,這為它們在傳統(tǒng)剛性機器人無法勝任的角色中部署提供了機會。另外,高度靈活的軟體機器人也很有可能成為制造業(yè)和倉庫環(huán)境中的關(guān)鍵部件。
下個月即將在溫哥華召開的神經(jīng)信息處理系統(tǒng)(Neural Information Processing Systems)會議上,麻省理工學院的研究者將詳細介紹一種優(yōu)化軟體機器人控制和設(shè)計的新方法。基于此方法,軟體機器人將能夠完成過去由于嚴重依賴計算能力而難以完成的任務(wù)。
軟體機器人能夠延展和操控自己形狀,是極其靈活的。從計算的角度來看,這意味著它們有無數(shù)種運動方式,讓計算機的訓練任務(wù)變得極其繁重。
該項研究的第一作者、計算機科學與人工智能實驗室(CSAIL)畢業(yè)生安德魯·斯皮爾伯格(Andrew Spielberg)在博客中寫道:“軟體機器人是無限維的生物,在任意給定時刻都有上十億種不同的彎曲方式,但事實上,軟物體有其自然的彎曲方式。我們發(fā)現(xiàn)軟體機器人的自然狀態(tài)可以非常簡潔地用低維來描述。我們通過學習對可能狀態(tài)的良好描述來優(yōu)化軟體機器人的控制和設(shè)計。”
為了訓練和開發(fā)他們的軟體機器人應(yīng)用程序,研究人員創(chuàng)建了一個模擬,以訓練二維和三維軟體機器人完成諸如抵達目標物體以及操控自身形狀等任務(wù)。實驗證明,該模擬中,機器人程序化運動的速度和精度都比復雜的傳統(tǒng)方法有了顯著提高。通常需要進行多達30000次模擬才能實現(xiàn)的優(yōu)化,新方法只需400次。
在模擬中,一個名為“觀察者”的程序計算所有變量,并監(jiān)督一個軟體機器人完成指定任務(wù)的情況。此前,研究人員設(shè)計了一簇包含機器人可進行的運動詳細信息的parTIcle(粒子仿真),如果機器人試圖越過這些限制,則會被抵抗運動的制動器阻止。然而,手工設(shè)置所有這些規(guī)則是非常耗時的。
為了解決這個問題,研究人員創(chuàng)建了一個“循環(huán)學習優(yōu)化(learning-in-the-loop opTImizaTIon)”,其中所有參數(shù)都是在多個模擬中通過一個反饋循環(huán)來學習的。
麻省理工學院指出:“該模型采用了一種稱為物質(zhì)點法(MPM)的技術(shù),該技術(shù)模擬由背景網(wǎng)格包圍的連續(xù)物質(zhì)(如泡沫和液體)的粒子行為。過程中,它將機器人及其可觀察環(huán)境的粒子捕獲為像素或三維像素,稱為體素,無需任何額外計算。”
來自模擬的所有信息都由機器學習處理,機器學習創(chuàng)建一個壓縮的低維粒子網(wǎng)格表示,然后可以用作機器人的狀態(tài)表示。隨后,控制器可以使用這些參數(shù)來調(diào)整每個粒子的最佳剛度,從而優(yōu)化機器人的運動。在未來,軟體機器人可以為特定任務(wù)以不同的剛度被3D打印出來。