揭秘NVIDIA GR00T人形機(jī)器人項(xiàng)目本質(zhì),快看!
NVIDIAGR00T是英偉達(dá)旗下的人形機(jī)器人項(xiàng)目之一,NVIDIAGR00T項(xiàng)目受到很多朋友的關(guān)注。為增進(jìn)大家對(duì)NVIDIAGR00T的認(rèn)識(shí),本文將對(duì)NVIDIAGR00T的本質(zhì)予以詳細(xì)介紹。如果你對(duì)NVIDIAGR00T或是對(duì)本文內(nèi)容具有興趣,不妨和小編一起來繼續(xù)往下閱讀哦。
一、NVIDIAGR00T 引言
據(jù)預(yù)測(cè),未來二十年,人形機(jī)器人市場(chǎng)將迎來爆發(fā)式增長(zhǎng),市場(chǎng)規(guī)模有望達(dá)到380億美元。為應(yīng)對(duì)這一巨大市場(chǎng)需求,特別是在工業(yè)和制造業(yè)領(lǐng)域的迫切需求,NVIDIA在近日CES展會(huì)上宣布了一系列重要舉措。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛親自揭曉了NVIDIA Isaac GR00T Blueprint的發(fā)布。這一Blueprint旨在加速下一代人形機(jī)器人的開發(fā)進(jìn)程,通過提供機(jī)器人基礎(chǔ)模型、數(shù)據(jù)管線和仿真框架,為開發(fā)者提供強(qiáng)有力的支持。
Isaac GR00T Blueprint的核心功能在于其能夠生成海量的合成運(yùn)動(dòng)數(shù)據(jù)。這些數(shù)據(jù)將幫助開發(fā)者通過模仿學(xué)習(xí)來訓(xùn)練人形機(jī)器人,從而大幅提升機(jī)器人的運(yùn)動(dòng)能力和適應(yīng)性。這一創(chuàng)新技術(shù)的推出,無疑將為人形機(jī)器人的研發(fā)帶來革命性的突破。
NVIDIA表示,將繼續(xù)加大在人形機(jī)器人領(lǐng)域的研發(fā)投入,與全球開發(fā)者攜手共進(jìn),共同推動(dòng)人形機(jī)器人技術(shù)的創(chuàng)新與發(fā)展。
二、GR00T 的本質(zhì)
GR00T 本質(zhì)上是為眾多人形機(jī)器人提供的一個(gè) AI 平臺(tái),其中包括波士頓動(dòng)力、Figure AI 和小鵬等公司。英偉達(dá)在 去年 GTC 大會(huì)上發(fā)布了人形機(jī)器人項(xiàng)目 GR00T,旨在 開發(fā)人形機(jī)器人的通用基礎(chǔ)模型,該模型將多模式指令和過去的交互作為輸入并輸出機(jī) 器人動(dòng)作。這種先進(jìn)的模型是模塊化的,具有用于高級(jí)推理和規(guī)劃以及低級(jí)快速、準(zhǔn)確 和反應(yīng)性運(yùn)動(dòng)的系統(tǒng)。GR00T 項(xiàng)目使用了 NVIDIA 三臺(tái)計(jì)算機(jī)機(jī)器人堆棧的所有部分, 其中包括用于訓(xùn)練模型的 NVIDIA AI 和 DGX?、用于強(qiáng)化學(xué)習(xí)的 NVIDIA Isaac? Lab, 以及用于加速機(jī)器人運(yùn)行時(shí)間的 NVIDIA Jetson ? Thor 和 Isaac ROS。
1)NVIDIA DGX:NVIDIA DGX Cloud 是一個(gè)面向開發(fā)人員的端到端的 AI 平臺(tái),也是 英偉達(dá)推出的一項(xiàng)云計(jì)算服務(wù),旨在為用戶提供高性能計(jì)算資源,特別是針對(duì)深度學(xué)習(xí) 和 AI 應(yīng)用,該服務(wù)主要是基于英偉的 DGC 系列超級(jí)計(jì)算機(jī),且這些超級(jí)計(jì)算機(jī)具備強(qiáng) 大的 GPU 和深度學(xué)習(xí)加速器,能夠迅速進(jìn)行負(fù)責(zé)的計(jì)算任務(wù)。
2)NVIDIA Isaac Lab:基于 NVIDIA Omniverse?平臺(tái)構(gòu)建,該平臺(tái)專門針對(duì)機(jī)器人 學(xué)習(xí)進(jìn)行了優(yōu)化,對(duì)于機(jī)器人基礎(chǔ)模型訓(xùn)練至關(guān)重要。它針對(duì)強(qiáng)化、模仿和遷移學(xué)習(xí)進(jìn) 行了優(yōu)化,能夠訓(xùn)練所有類型的機(jī)器人實(shí)例。
3)Isaac ROS on Jetson Thor:NVIDIA Isaac ROS 是一組加速計(jì)算包和 AI 模型,旨 在簡(jiǎn)化和加快高級(jí) AI 機(jī)器人應(yīng)用程序的開發(fā)。每一款 Jetson 系列都是一個(gè)完整的系統(tǒng) 模組(SOM),Jetson 系列是面向人形機(jī)器人開發(fā)的解決方案,滿足各種應(yīng)用的性能和預(yù) 算需求,這套方案中不僅僅有高性能、高度集成的芯片(系統(tǒng)芯片包含基于 NVIDIA Blackwell 架構(gòu)的下一代 GPU,并配備變壓器引擎,提供 800 萬億次浮點(diǎn) AI 性能,可運(yùn) 行 GR00T 等多模態(tài)生成式 AI 模型)平臺(tái),還有豐富的配套資源。
分層端到端模型大大加快了人形機(jī)器人的訓(xùn)練速度。人形機(jī)器人大模型從最初的大語言 模型到現(xiàn)在的分層端到端模型,產(chǎn)生了巨大的變化。在最開始,人形機(jī)器人的運(yùn)動(dòng)動(dòng)作 基本上是通過軟件層面預(yù)先編碼的,如波士頓動(dòng)力基本上是采用預(yù)設(shè)路徑。隨后出現(xiàn)的 大語言模型,初步讓人形機(jī)器人脫離預(yù)設(shè)路徑可以自主決策,但最初的 LLM 并非是端到 端的模型,而是僅能識(shí)別文字、或是獨(dú)立分為多個(gè)模塊的模型,無法及時(shí)反饋和涌現(xiàn)能 力也不夠強(qiáng)大。大模型發(fā)展至今,端到端模型已經(jīng)成為人形機(jī)器人首選,目前的分層端到端模型相比傳統(tǒng)的大語言模型存在諸多的優(yōu)點(diǎn):
1)精確度高:端到端模型是指輸入數(shù)據(jù)后輸出端會(huì)得到一個(gè)較準(zhǔn)確的預(yù)測(cè)結(jié)果,通常分 為控制、執(zhí)行和決策三個(gè)層級(jí),在計(jì)算過程中,每一個(gè)層級(jí)得到的結(jié)果均會(huì)反向反饋以 得到較為精確的決策。
2)高效性:端到端模型相比大語言模型內(nèi)部更為緊湊,系統(tǒng)內(nèi)部計(jì)算流程更快,模型反 應(yīng)效率也更高。
3)靈活性:相比傳統(tǒng)大語言模型智能處理文本 token,端到端模型可以處理諸多如圖像、 聲音、動(dòng)作、3D 信息等輸入內(nèi)容,模型只需微調(diào)便可轉(zhuǎn)換場(chǎng)景。
4)可以通過仿真模擬收集收據(jù):不再需要每個(gè)動(dòng)作都需要人類或視頻教機(jī)器人學(xué)習(xí),端 到端模型泛化能力較長(zhǎng),機(jī)器人可自行學(xué)習(xí)和計(jì)算相應(yīng)的動(dòng)作。
以上便是此次帶來的GR00T 相關(guān)內(nèi)容,通過本文,希望大家對(duì)GR00T 已經(jīng)具備一定的了解。如果你喜歡本文,不妨持續(xù)關(guān)注我們網(wǎng)站哦,將于后期帶來更多精彩內(nèi)容。最后,十分感謝大家的閱讀,have a nice day!