面向國產(chǎn)具身智能,多模態(tài)“感算控”一體化單芯片解決方案|為旌科技 VS859 亮相第十五屆松山湖論壇
在近期北京亦莊舉辦的機器人馬拉松中,人形機器人作為具身智能的代表,仍需人工輔助進行散熱、換電池,甚至會出現(xiàn)跑偏現(xiàn)象。這表明,當前的人形機器人距離人類水平仍有較大差距。未來幾年,針對特定場景的專用智能體(如工業(yè)或服務機器人)將成為產(chǎn)業(yè)落地的主要方向,這也是為旌科技對具身智能的認知和判斷。
在第十五屆松山湖中國IC創(chuàng)新高峰論壇上,上海為旌科技有限公司市場總監(jiān)黃智先生為我們介紹了VS859芯片,一款面向具身智能的高性能“感算控”一體化芯片。繼去年發(fā)布VS839芯片后,VS859的推出標志著公司在機器人感知、計算和控制領域的又一重大突破。黃智分享了公司對人工智能與機器人融合的洞察,闡述了VS859在推動具身智能發(fā)展中的關鍵作用以及未來的產(chǎn)業(yè)前景。
具身智能演進:“做好車才能做好機器人”
具身智能是人工智能(AI)與機器人技術交叉融合的產(chǎn)物,也是技術進步的自然結果。黃智回顧了AI的發(fā)展歷程:從專家系統(tǒng)到機器學習、深度學習,再到如今需要物理載體的場景化應用。機器人最初被設計用于自動化,基于人類經(jīng)驗或規(guī)則執(zhí)行簡單、重復的繁重任務。隨著技術進步,機器人從單一的機械臂替代人工,逐步發(fā)展為需要感知抓取力度、物體位置等復雜能力的功能模塊。這種演進要求機器人具備更強的感知和決策能力,從而催生了具身智能的核心要素:大腦(認知)、小腦(執(zhí)行)與多模態(tài)感知的結合。
然而,當前的具身智能仍未達到理想狀態(tài)。黃智以自動駕駛的分級方式類比,提出了機器人自主性的分級概念。1至3級為輔助自動化階段,機器人執(zhí)行預定義指令或特定任務,如機械臂、移動模塊或抓取模塊。從3級以上,機器人開始具備自主感知和決策能力。當前,感知技術(如視覺、雷達、毫米波、雙目深度感知)已接近成熟,產(chǎn)業(yè)化應用逐步展開。然而,認知能力仍處于初級階段。盡管像DeepSeek這樣的大型模型在知識積累上已超越人類,但在邏輯推理、語境理解等方面仍有不足。例如,機器人需要識別同一句話在不同語氣、表情或場景下的含義,這需要更深入的學習和數(shù)據(jù)積累。
黃智還提到,與自動駕駛相比,通用機器人的發(fā)展面臨更大挑戰(zhàn)。自動駕駛已積累了數(shù)十億公里的訓練數(shù)據(jù),而通用機器人缺乏類似規(guī)模的數(shù)據(jù)支持。正如業(yè)內(nèi)人士所說,“做好車才能做好機器人”,這意味著具身智能的道路仍需長期探索。
VS859:多模態(tài)的感算控一體芯片級解決方案
為應對具身智能的復雜需求,上海為旌科技推出了VS859芯片,該芯片已在2024年北京安博會上發(fā)布,并實現(xiàn)量產(chǎn)。VS859是一款高性能、超均衡的單芯片平臺,集感知、計算和控制于一體,滿足機器人對多模態(tài)感知、實時處理、低延時交互和高性價比的要求。
為旌科技設計的VS859芯片平臺,它是一款集成了高性能圖像處理、人工智能(AI)計算和傳感器數(shù)據(jù)管理的解決方案。該平臺采用了2核實時操作系統(tǒng)(RTOS)工作頻率為1.0GHz,8核ARM Cortex-A55 CPU,頻率為1.5GHz,2核NPU支持每秒6 TOPS的計算能力(8位精度),同時配備2核DSP,具有96G FLOPS的性能,能夠有效處理數(shù)據(jù)。該平臺集成了1.2G像素/秒的高質量圖像信號處理器(ISP),支持多層3D降噪技術,并且采用AI驅動的ISP,確保高質量的圖像處理能力。同時,VS859芯片還支持8K@30fps的視頻編碼,采用H.265/H.264視頻編碼格式,適用于高分辨率視頻應用。該平臺支持8K分辨率,具有出色的多層3D降噪技術,可在不同環(huán)境條件下優(yōu)化圖像質量,確保圖像清晰且無噪點。此外,系統(tǒng)還使用了無損數(shù)據(jù)壓縮等圖像處理技術,以便實時處理高質量的視頻和圖像數(shù)據(jù)。
在人工智能加速方面,VS859芯片的NPU專為AI工作負載加速設計,能顯著提升任務處理效率,特別適用于目標檢測和人臉識別等低延遲任務。其軟件工具鏈包含了量化(Quantization)功能,能夠減少計算復雜度,還配有自定義編譯器,優(yōu)化AI模型的運行效率。該平臺還提供豐富的連接選項,包括PCIe 3.0、USB 3.0和CAN等,便于與外部設備的通信。
VS859芯片非常適合用于自動駕駛、監(jiān)控和機器人等應用領域,能夠實時處理來自多個傳感器的數(shù)據(jù)。它支持最多8個攝像頭模塊,可實現(xiàn)360°全景視圖,特別適合高精度的追蹤系統(tǒng)和復雜場景分析,為自主系統(tǒng)提供了強大的解決方案。
結語
VS859芯片是為旌科技在具身智能業(yè)務開拓上的重要里程碑,其高性能、超均衡的“感算控”一體化設計為下一代機器人提供了強大支持。通過解決感知、計算和控制的核心需求,上海為旌科技正推動專用機器人在多樣化場景中的落地應用。隨著公司持續(xù)創(chuàng)新,VS859及未來芯片有望在產(chǎn)業(yè)轉型中發(fā)揮關鍵作用,助力具身智能成為現(xiàn)實。