想要實(shí)現(xiàn)自動(dòng)駕駛,首先要解決“橫行”的小車(chē)
配備“千里眼”和“最強(qiáng)大腦”,自動(dòng)駕駛汽車(chē)毫無(wú)疑問(wèn)已經(jīng)初具無(wú)障礙行駛的能力了。
據(jù)了解,目前,主流自動(dòng)駕駛汽車(chē)對(duì)車(chē)輛、行人或是動(dòng)物的識(shí)別準(zhǔn)確率日漸提升,這得益于它們裝備的不同的傳感設(shè)備和算法系統(tǒng)。但多數(shù)人沒(méi)想到的是,道路上那些最輕、最安靜、最靈活的小車(chē),可能成為自動(dòng)駕駛在未來(lái)的最大挑戰(zhàn)。
背景:“小”麻煩
“自行車(chē)可能成為自動(dòng)駕駛系統(tǒng)面臨的,最艱難的檢測(cè)難題”,來(lái)自加州大學(xué)伯克利分校的研究工程師Steven Shladover如是說(shuō)。
加州大學(xué)的視覺(jué)計(jì)算專家Nuno Vasconcelos也表達(dá)了類(lèi)似的觀點(diǎn),他認(rèn)為自行車(chē)正因相對(duì)小巧、靈活并且結(jié)構(gòu)特殊,可能會(huì)使自動(dòng)駕駛汽車(chē)面臨一種復(fù)雜的計(jì)算難題。“汽車(chē)就像一個(gè)‘龐然大物’,但自行車(chē)的質(zhì)量就小得多,而且它們的外形各不相同——比如不同形狀、不同顏色、不同掛飾等等。”
這也解釋了一個(gè)問(wèn)題,就是為什么近年來(lái)自動(dòng)駕駛車(chē)對(duì)汽車(chē)的檢測(cè)正確率已經(jīng)超過(guò)了自行車(chē)。當(dāng)然,其中也包括一些算法訓(xùn)練的原因。目前自動(dòng)駕駛汽車(chē)的路況檢測(cè)算法,一大部分是基于圖像的深度學(xué)習(xí),而主要的“學(xué)習(xí)”對(duì)象是汽車(chē)特征,自行車(chē)則相對(duì)較少。
轉(zhuǎn)機(jī):算法顛覆
話說(shuō)到這兒,就要祭出一個(gè)近期剛剛發(fā)布的神秘算法了。這個(gè)“神秘”更多不在于算法本身,而是其頗為有趣的研究團(tuán)隊(duì)陣容。我們了解到,去年年底,這幾位研究人員發(fā)布了他們名為“Deep3DBox”的算法論文。
從上圖就看得出,論文由三人合力完成,其中一人來(lái)自喬治?梅森大學(xué),而另外兩位,則來(lái)自極盡低調(diào)之能卻被炒得聲名在外的,無(wú)人駕駛汽車(chē)創(chuàng)業(yè)公司Zoox。
了解這一領(lǐng)域的人應(yīng)該對(duì)Zoox多少有所耳聞,這家坐標(biāo)美國(guó)硅谷的初創(chuàng)公司致力于無(wú)人駕駛汽車(chē)研發(fā)。去年10月,一筆高達(dá)5000萬(wàn)融資過(guò)后,Zoox身價(jià)已經(jīng)一躍達(dá)到了10億美元。雖然Zoox可能壓根兒沒(méi)有“外宣”部門(mén),但它的技術(shù)員工陣容十分強(qiáng)大,一些資料顯示,部分員工曾供職于谷歌、蘋(píng)果、特斯拉等公司。
回到三人共同研發(fā)的最新算法“Deep3DBox”,用頗為外行的話解釋,就是這種算法獨(dú)創(chuàng)了一種方式,能夠從2D照片中提取3D的目標(biāo)檢測(cè)和姿態(tài)估計(jì)。測(cè)試數(shù)據(jù)顯示,Deep3DBox能夠識(shí)別89%的車(chē)輛,而之前這一記錄保持者(學(xué)術(shù)方向)的成績(jī)是70%。
美國(guó)商用數(shù)學(xué)軟件MATLB中對(duì)上圖提到的“boundingbox”(邊界框)一詞做過(guò)定義,即“get the properties of region”,意思是用來(lái)度量圖像區(qū)域?qū)傩缘暮瘮?shù)。在許多基于2D圖像的信息識(shí)別中,都用到過(guò)這個(gè)函數(shù),例如車(chē)牌識(shí)別等等。
在這個(gè)背景下,我們就能更直觀地理解圖像識(shí)別中,2D boundingbox 和3D boundingbox的區(qū)別。比如,機(jī)器人在圖像中用2D boundingbox抓取到一輛汽車(chē),就等于用一個(gè)正方形圈出了它,但 3D boundingbox 圈出的卻是一個(gè)“立方體”,在空間幾何尺度,3D boundingbox能夠計(jì)算出更多的信息。
現(xiàn)在,Deep3DBox正試圖攻破一個(gè)更大的挑戰(zhàn):那就是依托他們的算法,將目標(biāo)車(chē)輛周?chē)?D圖像中的障礙物三維化,以預(yù)測(cè)車(chē)輛的行進(jìn)路線。
喬治?梅森大學(xué)的計(jì)算機(jī)科學(xué)家 Jana Ko?ecká 解釋說(shuō),“深度學(xué)習(xí)通常只適用于像素模式下的檢測(cè)和識(shí)別,但我們找到了一種方法,能使用類(lèi)似的手段評(píng)估出幾何層面上的量級(jí)。”Ko?ecká 還有一個(gè)特殊的身份,那就是Deep3DBox項(xiàng)目的投資人。
瓶頸:自行車(chē)難題
Deep3DBox已經(jīng)較原來(lái)的深度學(xué)習(xí)方式有了很大改進(jìn),但自行車(chē)識(shí)別依然是他們的難題。
團(tuán)隊(duì)發(fā)現(xiàn),每當(dāng)算法涉及到為自行車(chē)定位和定向時(shí),其識(shí)別性能會(huì)顯著下降。在基準(zhǔn)測(cè)試中,算法的目標(biāo)識(shí)別率僅為74%,即便這已經(jīng)算得上同類(lèi)算法中的最好成績(jī)了,但對(duì)于自動(dòng)駕駛汽車(chē)的完美運(yùn)行卻遠(yuǎn)遠(yuǎn)不夠。
定向測(cè)試中,Deep3DBox判斷對(duì)車(chē)輛判斷的準(zhǔn)確率達(dá)88%,但針對(duì)自行車(chē)的成績(jī)僅為59%。
Ko?ecka指出,相對(duì)而言,商業(yè)化的自動(dòng)駕駛系統(tǒng),其識(shí)別的準(zhǔn)確率會(huì)更高,因?yàn)樗鼈儷@取到了足夠多的道路數(shù)據(jù)來(lái)訓(xùn)練它們的系統(tǒng)。與此同時(shí),大多數(shù)路測(cè)汽車(chē)除了視覺(jué)算法,還裝配了如激光雷達(dá)(LiDAR)等傳感器,這些設(shè)備雖然無(wú)法預(yù)測(cè)自行車(chē)的行進(jìn)方向,但也可以幫助自動(dòng)駕駛汽車(chē)識(shí)別它們并計(jì)算相對(duì)位置。
之后,高精度地圖又為自動(dòng)駕駛系統(tǒng)帶來(lái)了更大的便捷。譬如Mobileye野心勃勃的道路管理系統(tǒng)(Road Experience Management,REM),他們?cè)噲D打造一種非常精確、非常實(shí)時(shí)的龐大地圖,同時(shí)在每輛車(chē)上配備可以上傳和下載實(shí)時(shí)地圖數(shù)據(jù)的軟件,從而達(dá)到一種理想狀態(tài)——使汽車(chē)僅僅依賴導(dǎo)航就完成自動(dòng)駕駛。這非常類(lèi)似于SLAM(即時(shí)定位于地圖構(gòu)建)的變種,但又遠(yuǎn)遠(yuǎn)沒(méi)有那么簡(jiǎn)單。
上面介紹的地圖,能夠先一步將自行車(chē)識(shí)別為道路異常,而后或許再由視覺(jué)算法處理。去年,福特汽車(chē)聯(lián)合5家公司投資高精度地圖初創(chuàng)公司Civil Maps,研發(fā)用于自動(dòng)駕駛汽車(chē)的3D地圖。福特方面已經(jīng)透露,今年開(kāi)展路測(cè)的自動(dòng)駕駛汽車(chē)將裝配“高精度3D地圖”。
將上述的技術(shù)有機(jī)結(jié)合,就能夠獲得更加理想的結(jié)果,例如谷歌去年剛發(fā)布的“自行車(chē)識(shí)別”技術(shù)。在新版本的技術(shù)中,谷歌提升了無(wú)人車(chē)對(duì)自行車(chē)的識(shí)別水平,并加入了自行車(chē)車(chē)主手勢(shì)(表達(dá)變換車(chē)道、轉(zhuǎn)向)識(shí)別等新算法,這正是為了避免其過(guò)去無(wú)法正確識(shí)別自行車(chē)行進(jìn)情況的問(wèn)題。
在剛剛落幕不久的2017底特律車(chē)展上,谷歌進(jìn)一步升級(jí)了自行車(chē)識(shí)別算法,并推出了專門(mén)針對(duì)自行車(chē)的傳感器技術(shù)。
商用:忌操之過(guò)急
加州大學(xué)視覺(jué)計(jì)算專家Vasconcelos依然對(duì)當(dāng)下的傳感和自動(dòng)化技術(shù)能否取代人類(lèi)保有質(zhì)疑,但他相信,目前的技術(shù)已經(jīng)能夠幫助人類(lèi)司機(jī)避免一些事故的發(fā)生。
未來(lái),自行車(chē)自動(dòng)檢測(cè)和識(shí)別面向商用化的第一步,很可能就是用于傳統(tǒng)車(chē)輛的自動(dòng)緊急剎車(chē)系統(tǒng)(AEB)。目前,AEB系統(tǒng)的功能已經(jīng)從單純的車(chē)輛檢測(cè)延伸到行人、自行車(chē)檢測(cè)等更大范疇。
2013年,沃爾沃開(kāi)始提供第一款支持自行車(chē)檢測(cè)的AEB系統(tǒng),系統(tǒng)搭載了攝像頭和雷達(dá)等設(shè)備,用于潛在的碰撞預(yù)警。今年歐洲的公共巴士中也裝備了類(lèi)似功能,值得一提的是,歐盟早在四五年前,就發(fā)布規(guī)定,要求新車(chē)配備AEB系統(tǒng)。
如今,越來(lái)越多的車(chē)企也在追隨“歐洲模式”,期望將自行車(chē)檢測(cè)功能加入AEB系統(tǒng)的性能評(píng)級(jí)中。
也就是說(shuō),AEB系統(tǒng)未來(lái)的要應(yīng)對(duì)的問(wèn)題就更復(fù)雜了,甚至是和自動(dòng)駕駛車(chē)研發(fā)人員面臨相同的挑戰(zhàn)。而這個(gè)挑戰(zhàn),就是“預(yù)測(cè)障礙物的行進(jìn)”。而其中最最嚴(yán)苛的要求,莫過(guò)于對(duì)自行車(chē)進(jìn)行檢測(cè)預(yù)警的AEB系統(tǒng),負(fù)責(zé)歐洲自行車(chē)-AEB系統(tǒng)基準(zhǔn)測(cè)試的高級(jí)顧問(wèn)Op den Camp指出,自行車(chē)的移動(dòng)幾乎是最難被預(yù)測(cè)的。
Ko?ecká也同意這個(gè)觀點(diǎn),“自行車(chē)的可預(yù)測(cè)性比汽車(chē)低很多,因?yàn)樗鼈兒苋菀淄蝗晦D(zhuǎn)向或消失在視野中”。
這些觀點(diǎn)都意味著,將自行車(chē)排除在人為事故風(fēng)險(xiǎn)之外(美國(guó)管理機(jī)構(gòu)數(shù)據(jù),94%的交通事故由人為失誤造成)尚需日時(shí)。舊金山自行車(chē)聯(lián)盟的執(zhí)行董事Brian Wiedenmeier說(shuō),“每個(gè)騎自行車(chē)的人都在期盼這項(xiàng)技術(shù)的到來(lái)”,但他也同時(shí)表示,應(yīng)靜待自動(dòng)化技術(shù)成熟再投入使用。
據(jù)了解,去年12月,Uber曾在加州某試點(diǎn)測(cè)試自動(dòng)駕駛出租車(chē)服務(wù),Wiedenmeier那時(shí)就對(duì)Uber發(fā)出過(guò)警告。他指出,這些汽車(chē)無(wú)視當(dāng)?shù)貙樽孕熊?chē)劃定的車(chē)道線,這違背了加州保護(hù)自行車(chē)騎行者安全的相關(guān)法規(guī)。
去年底,Uber一路與加州監(jiān)管部門(mén)死扛,加州希望Uber獲得DMV(美國(guó)車(chē)輛管理局)許可后上路,但Uber無(wú)視繼續(xù)路測(cè),之后這種行為遭到禁止。
目前,Uber的自動(dòng)駕駛汽車(chē)仍在亞利桑那州和匹茲堡進(jìn)行路測(cè),而就在不久前,加州街頭也重現(xiàn)一些Uber路測(cè)車(chē)的身影,不過(guò)消息顯示,這些車(chē)輛只被允許收集舊金山街道的測(cè)繪地圖數(shù)據(jù),并必須保證有人類(lèi)駕駛員在車(chē)內(nèi)。
Wiedenmeier說(shuō),Uber對(duì)市場(chǎng)的“急功近利”行為是錯(cuò)誤的。“任何新技術(shù)都需要審慎地測(cè)試和檢驗(yàn)。