www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 原創(chuàng) > 劉巖軒
[導讀]在CoRL 2025上,英偉達發(fā)布了全新的Isaac GR00T N1.6人形機器人基礎模型和Newton物理引擎。Isaac GR00T N1.6預集成了Cosmos Reason作為核心組件,將大幅提升機器人的“腦力”,而Newton來自與Google DeepMind、Disney Research合作的成果,將會增強機器人在復雜物理世界中的“運動表現(xiàn)”。除此外,英偉達也帶來了全新的世界基礎模型更新,包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。

機器人的“思考腦力”提升+“運動表現(xiàn)”增強,英偉達發(fā)布全新Isaac GR00T N1.6、Newton物理引擎和全新世界基礎模型

如何讓人形機器人變得更加“類人化”?這是業(yè)界探索的方向。在學習能力上,我們期望機器人具備泛化能力、模糊指令的推理能力;在運動表現(xiàn)上,我們希望其能夠應對真實物理世界的各種復雜環(huán)境、實現(xiàn)更好的環(huán)境感知和更高難度復雜動作。而在整個的訓練過程中,我們又期待能夠進一步縮短Sim2Real的差距,加速機器人的開發(fā)和部署。所有的這些背后,離不開強大的仿真引擎、推理模型和更全面的工具集。

在CoRL 2025上,英偉達發(fā)布了全新的Isaac GR00T N1.6人形機器人基礎模型和Newton物理引擎。Isaac GR00T N1.6預集成了Cosmos Reason作為核心組件,將大幅提升機器人的“腦力”,而Newton來自與Google DeepMind、Disney Research合作的成果,將會增強機器人在復雜物理世界中的“運動表現(xiàn)”。除此外,英偉達也帶來了全新的世界基礎模型更新,包括即將推出的Cosmos Predict 2.5和Cosmos Transfer 2.5。


NVIDIA Newton:可微分物理能力提升復雜任務訓練效率

NVIDIA Newton 是一個開源、GPU 加速的物理引擎,于今年3月在GTC San Jose首次宣布,由 NVIDIA 聯(lián)合 Google DeepMind 和 Disney Research 共同開發(fā),基于 NVIDIA Omniverse 平臺和 OpenUSD 格式構建。該引擎專為機器人研究人員設計,旨在通過高保真、可微分的物理模擬加速機器人訓練與開發(fā)。其 Beta 版本現(xiàn)已向所有機器人開發(fā)者開放,由 Linux Foundation 托管,確保其開源性和社區(qū)驅動特性。

Newton 的設計目標是解決機器人訓練中的關鍵挑戰(zhàn),特別是人形機器人和其他復雜機器人系統(tǒng)在關節(jié)、平衡和運動方面的復雜性。它通過提供靈活、模擬器無關的架構,與多種機器人學習框架(如 Joker 和 NVIDIA Isaac Lab)無縫兼容。Newton 具備可微分物理能力,使機器人能夠通過試錯學習動作如何影響環(huán)境結果,類似于人類通過反復嘗試優(yōu)化行為。使用可微分物理模擬器訓練控制策略,梯度可以直接從任務目標(如末端執(zhí)行器位置)反向傳播到控制輸入。這種方式相比強化學習的路徑更高效,樣本利用率高,因此這種特性特別適用于訓練機器人執(zhí)行移動和物體操縱等復雜任務。

此外,Newton 支持多種求解器協(xié)同工作,能夠處理復雜的多場景模擬,提升了其靈活性和擴展性。全球領先的學術機構,包括蘇黎世聯(lián)邦理工學院機器人系統(tǒng)實驗室、慕尼黑工業(yè)大學和北京大學,已開始采用 Newton,用于機器人研究和開發(fā)。NVIDIA Omniverse和模擬技術副總裁Rev Lebaredian強調(diào),Newton 的開源性質(zhì)使其成為社區(qū)驅動的工具,旨在推動全球機器人學界的合作與創(chuàng)新。

通過 Newton,NVIDIA 為機器人開發(fā)者提供了強大的模擬工具,助力生成物理準確的合成數(shù)據(jù),減少對成本高昂且潛在危險的現(xiàn)實世界數(shù)據(jù)的依賴,從而加速物理 AI 的開發(fā)和部署。


泛化能力提升,更具“類人”推理能力——NVIDIA Isaac GR00T N1.6集成“深度思考大腦”

自OpenAI 的 CLIP(Contrastive Language–Image Pretraining)模型的成功之后,VLA實現(xiàn)了處理靜態(tài)視覺信息和語言關聯(lián)方面的成功,為機器人感知環(huán)境奠定了基礎。但Rev Lebaredian指出:“它們(VLA)尚未能夠解決多步任務,也無法處理歧義或新奇體驗。人類可以基于日常經(jīng)驗導航物理世界中多樣化場景的長尾。但人形機器人需要推理能力來理解歧義指令并適應全新的、陌生的情境?!?

換言之,現(xiàn)在的VLA模型很擅長認東西、找規(guī)律,但遇到需要多步操作、模糊指令或全新場景時就“懵了”。而我們?nèi)祟惪咳粘=?jīng)驗能輕松應對各種復雜情況,但機器人要想做到類似的事,必須有“思考”、“推理”能力,能理解模糊的話、適應沒見過的情景。而這就是NVIDIA Isaac GR00T N1.6將要幫助機器人“進化”的下一步目標。

此次發(fā)布的NVIDIA Isaac GR00T N1.6 是開源機器人基礎模型的全新版本,即將登陸Hugging Face平臺。相比Isaac GR00T N1.5,它最大的特點在于——集成了Cosmos Reason作為核心組件,能夠大幅提升機器人在不同場景中的泛化能力。

從人類學習的角度看,泛化能力是一種核心認知機制。幼童通過有限互動學會用勺子吃飯后,能將技能泛化到不同餐具或環(huán)境,源于大腦提取抽象規(guī)則而非死記硬背。這種能力遷移到機器人,即從有限訓練數(shù)據(jù)中習得知識,應用于未見環(huán)境、物體或任務,避免僅在特定場景有效。而推理能力是這種泛化的認知基礎,通過語義解析、知識遷移和動態(tài)調(diào)整,機器人能理解模糊指令(如“拿那個東西”)并適應新場景(如未知廚房等)。通過推理能力來提取通用規(guī)則,然后才能實現(xiàn)機器人的泛化表現(xiàn),實現(xiàn)機器人從“專才”向“通才”的轉型,類似人類通過邏輯應對復雜世界。提升泛化需增強推理,如通過多模態(tài)訓練或因果推理模塊優(yōu)化。

Cosmos Reason是一個開源且可定制的推理視覺語言模型,專為物理AI設計。而將Cosmos Reason引入 Isaac GR00T N1.6,就類似于為人形機器人注入一個“深度思考大腦”,它能處理模糊指令和從未見過的罕見場景,利用先驗知識、常識以及物理原理,將這些指令轉化為步步推進的行動計劃,從而實現(xiàn)跨任務的泛化能力。這使得 Isaac GR00T N1.6在執(zhí)行物理世界中的類人任務時顯著提升了推理水平,不再僅依賴預訓練數(shù)據(jù),而是能實時規(guī)劃和適應新環(huán)境,解決了傳統(tǒng)機器人模型在泛化方面的瓶頸。

除了Cosmos Reason的引入外,Isaac GR00T 1.6 還增強了人形機器人的運動與物體操作能力,提供了更大的軀干和手臂自由度,使機器人能夠應對更具挑戰(zhàn)性的任務,例如打開沉重的門。


世界基礎模型更新,加速Sim2Real進程

與基于互聯(lián)網(wǎng)海量人類知識訓練的傳統(tǒng)大語言模型(LLM)不同,物理 AI 模型的訓練面臨數(shù)據(jù)稀缺的挑戰(zhàn)?,F(xiàn)實世界數(shù)據(jù)的采集成本高昂且存在潛在風險,預訓練的局限性也限制了模型的迭代能力。機器人要實現(xiàn)從基礎感知到高級智能的演進,就需要具備足夠高質(zhì)量的數(shù)據(jù)支持。通過人類演示和合成數(shù)據(jù)生成(結合強化學習和物理模擬),能夠顯著提升機器人的模型能力。

Rev Lebaredian強調(diào),仿真對于開發(fā)和部署機器人至關重要,其作用主要體現(xiàn)在兩個方面。首先,仿真是生成訓練機器人智能所需數(shù)據(jù)的主要方式。機器人需要一種通用的智能,使其能夠在物理世界中工作,而這種智能的訓練依賴于物理準確、豐富多樣且能夠代表現(xiàn)實世界中各種情境的數(shù)據(jù)。由于在現(xiàn)實世界中收集這些數(shù)據(jù)的難度大、成本高,有時甚至在物理上不可行或存在危險,因此必須通過仿真來生成這些數(shù)據(jù)。其次,仿真在將新AI部署到物理機器人之前,用于測試其性能和安全性。在AI進入現(xiàn)實世界之前,我們需要確保其行為可靠,不會對自身或他人造成傷害,并能達到預期的表現(xiàn)。仿真提供了一個快速、安全且成本效益高的測試環(huán)境。因此,仿真不僅用于生成訓練AI所需的適當數(shù)據(jù),還用于以安全、可擴展的方式測試AI的性能,從而確保機器人在現(xiàn)實世界中的可靠性和安全性。

仿真是橋接虛擬與現(xiàn)實(Sim2Real)的關鍵橋梁,而英偉達正通過其最新創(chuàng)新來進一步強化這一橋梁。此次英偉達宣布將會帶來世界基礎模型的重大升級版,其中包括即將發(fā)布的Cosmos Predict 2.5和Cosmos Transfer 2.5。這一升級不僅能助力生成海量基于物理的合成數(shù)據(jù),幫助開發(fā)者克服現(xiàn)實世界數(shù)據(jù)收集的瓶頸,還能無縫集成到Omniverse模擬環(huán)境中,實現(xiàn)更精確的場景構建和AI測試,讓機器人開發(fā)變得更具可擴展性。

據(jù)悉,即將發(fā)布的Cosmos Predict 2.5能夠從初始狀態(tài)預測未來狀態(tài),實現(xiàn)三個獨立模型的統(tǒng)一,從而減少后訓練時間、復雜性和計算成本;其輸出質(zhì)量明顯高于先前版本以及同等規(guī)模的開源模型;此外,它現(xiàn)支持多視圖輸出,適用于多傳感器機器人和自動駕駛車輛,并能生成長達30秒的視頻。

而即將發(fā)布的Cosmos Transfer 2.5則負責世界到世界(world to world)的風格轉移,旨在彌合模擬環(huán)境和現(xiàn)實世界之間的感知鴻溝。其最新版本模型大小僅為上一代模型的 1/3.5,從而降低計算成本,并便于開發(fā)者增強和擴展訓練數(shù)據(jù)。這些模型的結合,使得生成數(shù)百個虛擬的、傳感器豐富的環(huán)境用于機器人訓練成為可能,從而顯著減少對現(xiàn)實世界數(shù)據(jù)的依賴。


從感知AI到物理AI,英偉達三臺計算機加速行業(yè)協(xié)作

AI的快速發(fā)展正在推動技術從感知AI向生成AI、代理AI,最終邁向物理AI的轉型。這一演進歷程始于十多年前AlexNet的出現(xiàn),AI由此進入大爆炸式發(fā)展階段,感知AI時代正式。當時,神經(jīng)網(wǎng)絡專注于單一任務,如圖像分類和語音識別。隨后,Transformer模型的發(fā)明引領了生成AI時代,模型規(guī)模更大、訓練數(shù)據(jù)更多,具備通用性,能執(zhí)行多種任務。目前,我們正步入代理AI時代,自主系統(tǒng)能夠在信息和知識領域使用工具、編寫代碼或執(zhí)行復雜任務。緊隨其后的是物理AI時代,代理AI被賦予物理實體,進入機器人領域。這一時代建立在過去十年的技術積累之上,尤其在自動駕駛汽車等特定機器人領域已顯現(xiàn)成熟跡象。自動駕駛作為運輸機器人的一種,因其主要任務是避免碰撞,相較于需與環(huán)境直接交互的通用機器人,技術實現(xiàn)相對簡單,但仍是物理AI的重要起點。

Rev Lebaredian強調(diào),構建物理AI和人形機器人是一項極其復雜的挑戰(zhàn),涉及眾多行業(yè)和子任務,單一公司難以獨立完成。所需的研究、工程以及商業(yè)模式創(chuàng)新規(guī)模龐大,因此需要整個行業(yè)生態(tài)系統(tǒng)的協(xié)作。英偉達在這一生態(tài)系統(tǒng)中定位明確,專注于為機器人和物理AI提供三種關鍵計算平臺:一是嵌入機器人內(nèi)部的Jetson Thor和IGX Orin計算機;二是生成機器人“大腦”的DGX和HGX AI工廠計算機;三是基于RTX Pro Blackwell平臺的Omniverse模擬計算機,用于AI大腦的開發(fā)與測試。這些計算平臺對機器人生態(tài)系統(tǒng)至關重要,但英偉達并非獨自承擔所有任務。行業(yè)需要其他公司開發(fā)機器人硬件、操作系統(tǒng)、管理工具以及特定場景的AI模型。英偉達的獨特優(yōu)勢在于其廣泛的合作網(wǎng)絡,幾乎所有從事物理AI或機器人的公司都在使用至少一種英偉達的計算平臺,許多公司甚至同時使用兩種或三種。這種合作模式凸顯了英偉達在推動物理AI和機器人產(chǎn)業(yè)向前發(fā)展中的核心角色,同時也反映了行業(yè)協(xié)作的必要性,以應對機器人技術發(fā)展的復雜性和多樣性。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據(jù)LED驅動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉