智能系統(tǒng)不迷路,機(jī)器人無(wú)人車的明燈
如何給機(jī)器人打造一雙在任何環(huán)境下自主定位導(dǎo)航的“眼睛”?
基礎(chǔ)創(chuàng)新是一個(gè)漫長(zhǎng)的賽道, 不過(guò)對(duì)于硅谷連續(xù)創(chuàng)業(yè)家龐琳勇博士(Leo)來(lái)說(shuō),他早已習(xí)慣?!靶∫捴悄苁俏业牡谌覄?chuàng)業(yè)公司,我的第二家公司從成立到最后被收購(gòu)做了10年。這沒(méi)什么奇怪的,賺快錢的公司很難有壁壘的。”龐琳勇以很自然的語(yǔ)氣回答。
畢業(yè)于美國(guó)斯坦福大學(xué),擁有機(jī)械工程博士和計(jì)算機(jī)科學(xué)碩士(機(jī)器人視覺專業(yè))的雙學(xué)位,并曾在中國(guó)科技大學(xué)師從光學(xué)測(cè)量泰斗伍小平院士,龐琳勇在立體視覺領(lǐng)域深耕多年并有多項(xiàng)研究成果。AI 時(shí)代的到來(lái),讓他在自己擅長(zhǎng)的領(lǐng)域看到了一個(gè)前所未有的剛需市場(chǎng)。
“每一次技術(shù)浪潮都會(huì)產(chǎn)生新的基礎(chǔ)建設(shè)需求。PC 時(shí)代,英特爾和微軟壟斷了 CPU 和操作系統(tǒng);移動(dòng)互聯(lián)網(wǎng)時(shí)代,ARM 攬括芯片,iOS 和安卓承包了操作系統(tǒng);AI 時(shí)代的來(lái)臨,你會(huì)發(fā)現(xiàn)無(wú)論是機(jī)器人還是自動(dòng)駕駛汽車,甚至 VR 和 AR 的應(yīng)用,其共性特點(diǎn)是動(dòng)起來(lái)了?!痹诹沼驴磥?lái),AI 時(shí)代高度強(qiáng)調(diào)“動(dòng)”,而事物要運(yùn)動(dòng),必須要有一雙認(rèn)路和看得出距離的“人眼”——這便是他的專長(zhǎng)。
2014 年,旨在讓機(jī)器人動(dòng)起來(lái)的小覓智能(MYNT AI)在硅谷成立了。其成員主要來(lái)自百度、三星、諾基亞、摩托羅拉等。
小覓智能專注立體視覺技術(shù)整體解決方案,是行業(yè)領(lǐng)先的視覺定位導(dǎo)航 VPS(Visual Positioning System)核心技術(shù)提供商。VPS 核心技術(shù)包括自主研發(fā)的雙目結(jié)構(gòu)光深度慣導(dǎo)相機(jī)、 視覺里程計(jì) VIO(Visual-InerTIal Odometry)技術(shù)、 VSLAM(Visual Simultaneous LocalizaTIon And Mapping) 技術(shù)、自動(dòng)駕駛、3D 識(shí)別/測(cè)量技術(shù)等。據(jù)龐琳勇介紹,小覓智能提供三個(gè)維度的產(chǎn)品,一是基礎(chǔ)層:各種各樣的雙目深度攝像頭硬件;二是自動(dòng)導(dǎo)航的底座,也就是雙目攝像頭加上 SLAM 的算法,企業(yè)可以在上面開發(fā)自己的機(jī)器人;第三層是針對(duì)不同的行業(yè)做的定位導(dǎo)航定制方案,如服務(wù)機(jī)器人,掃地機(jī)機(jī)器人、汽車輔助駕駛 ADAS 等。
簡(jiǎn)單來(lái)說(shuō),小覓智能想給機(jī)器人和無(wú)人車(機(jī))一雙靈敏的眼睛,幫助其自主行走。
說(shuō)起機(jī)器視覺,目前最熱門、最主要的兩大類應(yīng)用無(wú)非是識(shí)別和導(dǎo)航定位。小覓智能則是后者。和用于手機(jī)等的二維傳感器不同,深度傳感器能夠把物體的距離測(cè)量出來(lái)。目前市面上的深度相機(jī)主要分為三種:時(shí)間飛行法 TOF(TIme Of Flight)、雙目、結(jié)構(gòu)光。這三種方法皆有優(yōu)勢(shì)和局限性。
結(jié)構(gòu)光:屬于主動(dòng)光類,算法容易在芯片上實(shí)現(xiàn),較為成熟,圖像分辨率比較高,但測(cè)量距離較短(1~2米),容易受光照影響,不適用于室外環(huán)境;
TOF:屬于主動(dòng)光類,算法容易在芯片上實(shí)現(xiàn),抗干擾性能較機(jī)構(gòu)光要好, 深度精度高,不過(guò)其圖像分辨率較低(測(cè)的點(diǎn)少), 測(cè)量距離在5米左右,成本高;
雙目:屬于被動(dòng)光類,室內(nèi)外都工作,研究歷史較久,成本較低, 算法精度高,魯棒性強(qiáng),測(cè)量距離可以達(dá)到100米,但計(jì)算量大,算法復(fù)雜。 因?yàn)榉浅R蕾囎匀粓D像特征匹配,所以不適用于昏暗環(huán)境或者過(guò)度曝光環(huán)境,另外如果被測(cè)場(chǎng)景本身缺乏紋理,也很難進(jìn)行特征提取和匹配,如白墻。
眾所周知,機(jī)器人面臨的環(huán)境各色各異,所以,機(jī)器人需要一雙適應(yīng)任何環(huán)境的“眼睛”。而上述三個(gè)方案單一的來(lái)看都有明顯的不足。那么,如何打造一款較為完美的定位導(dǎo)航和避障方案呢?這正是龐琳勇的初衷。小覓智能以雙目為基礎(chǔ),加入結(jié)構(gòu)光,采用雙目的算法,再加上位移加速傳感器,形成了一套全新的完整的軟硬件一體化傳感器方案。
“測(cè)量距離幾十米,深度精度達(dá)到厘米級(jí),同時(shí)反應(yīng)速度又很快,可以適應(yīng)室內(nèi)室外工作,在三種傳感器中,只有應(yīng)用自然光的雙目比較理想。但是雙目也有自身的局限,它遇到室內(nèi)白墻,無(wú)法找到特征點(diǎn),所以也就沒(méi)法匹配左右目的相同的特征點(diǎn),其精度就會(huì)下降。而利用結(jié)構(gòu)光打紅外斑點(diǎn)到白墻上,相當(dāng)于形成了圖案,即可輔助雙目分辨?!饼嬃沼路浅I(yè)地解釋了結(jié)構(gòu)光和雙目的結(jié)合點(diǎn)。
“我們的定位導(dǎo)航方案就像人眼,看了周圍就可以知道自己的相對(duì)位置?!饼嬃沼陆忉尩?, “小覓智能其實(shí)在賦予機(jī)器人三維度空間感知的能力。這主要體現(xiàn)在兩個(gè)方面:定位導(dǎo)航和立體避障。首先,雙目攝像頭硬件需要測(cè)量機(jī)器人和各參照物的距離,然后用算法算出具體位置,這是定位導(dǎo)航。至于避障,以前的機(jī)器人,基本是靠超聲避障。但超聲只知道前面有東西,卻不知道這個(gè)東西離你有多遠(yuǎn),寬度多少,高度多少?!饼嬃沼陆忉尩?,“機(jī)器人避障一定要知道障礙物的精確位置以及大小,而傳統(tǒng)超聲方案無(wú)法解決這些問(wèn)題,視覺深度傳感器則完美地解決了這一問(wèn)題,所以很快成為機(jī)器人立體避障的標(biāo)配?!背酥?,小覓智能利用視覺傳感和位移加速傳感互補(bǔ)形成了一個(gè)更加全面的深度傳感器?!耙曈X對(duì)轉(zhuǎn)動(dòng)不太敏感,但是加速度傳感器可以測(cè)出轉(zhuǎn)動(dòng)的加速度,相當(dāng)于是將不同渠道收集到的信號(hào)融合在一起,保證了信息精確?!彼f(shuō)。
關(guān)于機(jī)器人自主導(dǎo)航定位的方案,我們比較熟悉的有思嵐科技,其利用了視覺傳感+激光雷達(dá)的方式。多傳感融合會(huì)增加其魯棒性,但激光雷達(dá)的使用大大增加了成本。龐琳勇希望用視覺傳感就可以讓機(jī)器人實(shí)現(xiàn)定位導(dǎo)航和避障, 實(shí)現(xiàn)低成本,易量產(chǎn)。而關(guān)于機(jī)器人的雙目軟硬件一體的研究,此前都主要存在于大學(xué)實(shí)驗(yàn)室里,真正應(yīng)用到工業(yè)級(jí)場(chǎng)景的還沒(méi)有。值得一提的是,小覓智能強(qiáng)實(shí)力的團(tuán)隊(duì)一直致力于將這個(gè)技術(shù)應(yīng)用帶出象牙塔。
針對(duì)不同行業(yè)機(jī)器人的不同需求,小覓已經(jīng)推出了兩版雙目結(jié)構(gòu)光深度慣導(dǎo)攝像頭:標(biāo)準(zhǔn)版和深度版。據(jù)龐琳勇介紹,標(biāo)準(zhǔn)版是雙目+結(jié)構(gòu)光+位移加速傳感器,后面的算法是在主機(jī)上的 CPU 或 GPU 進(jìn)行的。深度版本則是在標(biāo)準(zhǔn)版的基礎(chǔ)上加了專有芯片模塊,可以直接運(yùn)算,不用耗費(fèi)主機(jī)上的運(yùn)算資源。
“我們現(xiàn)在的商業(yè)模式主要是從深度攝像頭、到導(dǎo)航模塊、再到針對(duì)不同行業(yè)和場(chǎng)景的機(jī)器人定位導(dǎo)航和避障的解決方案。小覓攝像頭有標(biāo)桿型客戶,定位導(dǎo)航底盤得到了合作伙伴英偉達(dá)的推薦,業(yè)界的第一個(gè)雙目掃地機(jī)方案完成,至于服務(wù)機(jī)器人方案,我們現(xiàn)在正和一家公司在合作一個(gè)很特殊的場(chǎng)景,而且已經(jīng)拿到幾千臺(tái)的這個(gè)場(chǎng)景的機(jī)器人的訂單了?!饼嬃沼峦嘎?。
接下來(lái),龐琳勇透露,小覓智能在汽車輔助駕駛 ADAS 領(lǐng)域還可以大展拳腳。ADAS 輔助駕駛市場(chǎng)目前以單目攝像頭居多,以色列公司 Mobileye 占據(jù)了市場(chǎng)份額的半壁江山。不過(guò),龐琳勇表示單目攝像頭有一個(gè)缺點(diǎn):無(wú)法直接測(cè)距離,首先它要判斷出來(lái)前面是輛車,然后根據(jù)車牌的大小來(lái)反推距離。這兩個(gè)過(guò)程都容易出問(wèn)題,如假如它沒(méi)有識(shí)別出車就無(wú)法測(cè)距離?!岸p目不需要做判斷,可以直接算出來(lái)距離,減少失誤,所以雙目肯定是一個(gè)趨勢(shì)。”他說(shuō)。
作為一個(gè)在底層創(chuàng)新深耕較久的人,龐琳勇已經(jīng)有自己的一套創(chuàng)業(yè)看法。他認(rèn)為,一些基礎(chǔ)的創(chuàng)新需要團(tuán)隊(duì)做好多年,這些時(shí)間與精力鑄就了一個(gè)企業(yè)的壁壘?!本拖裎覀冏龅倪@個(gè)事情,別人不是想做就能做,他也需要花很多年的時(shí)間。而且很有可能做的產(chǎn)品和客戶想要的差的很遠(yuǎn)。”他表示,找準(zhǔn)需求市場(chǎng)也是必備課程。
“機(jī)器人移動(dòng)和無(wú)人車肯定需要知道自己在什么地方,在走過(guò)程中別撞上東西,這是一個(gè)普遍的需求,而且這個(gè)需求是以前沒(méi)有的。所以做這個(gè)肯定不會(huì)錯(cuò)?!饼嬃沼乱恢睂?duì)機(jī)器人自主導(dǎo)航的市場(chǎng)充滿了信心。小覓智能,2014 年剛成立時(shí)時(shí)只有 5 個(gè)人的創(chuàng)始團(tuán)隊(duì),在冬天沒(méi)有暖氣的無(wú)錫哆嗦著編程,2016 年 1 月其推出的搭載小覓雙目的小覓機(jī)器人在 CES 上獲得高度關(guān)注,而后,其將戰(zhàn)略轉(zhuǎn)變?yōu)樘峁┙鉀Q方案。這一路,小覓智能的每個(gè)腳印都非常清晰。
目前,小覓智能已經(jīng)完成了來(lái)自樂(lè)搏資本的天使輪融資、以及真格基金的 Pre-A 輪和來(lái)自成識(shí)資本、申通董事長(zhǎng)陳德軍、觸控科技、優(yōu)客工場(chǎng)和中關(guān)村國(guó)際控股的 A 輪融資,累計(jì)融資近億元。