自動(dòng)駕駛的人工智能該怎樣做
余凱博士在《自動(dòng)駕駛之計(jì)算與處理器》主題演講中指出,思考人工智能面對(duì)的感知認(rèn)知決策控制,是不是一定要從軟件驅(qū)動(dòng)場(chǎng)景驅(qū)動(dòng)的角度去思考這個(gè)問題?
余凱首先通過發(fā)問引發(fā)思考,我們知道在宇宙中最聰明的設(shè)備是什么?是人的大腦,人的大腦看所無所不知,無所不能,但是問題是不是這樣呢?有時(shí)候大腦的行為也讓人很費(fèi)解,首先我們知道我們?cè)谔幚韴D像不是按照順序,實(shí)際上我們是不管前后上下,對(duì)圖象變形處理,使得我們能夠滑雪能夠在高速公路飆車。但是我們又能夠把這個(gè)數(shù)據(jù)接起來,我們有腦補(bǔ)的能力,這個(gè)能力是人區(qū)別于很多動(dòng)物的根本,腦補(bǔ)能力使我們能干很多很奇妙的事情——你在不斷預(yù)測(cè)未來,使得我們高效的處理很多的事情。
未來包括自動(dòng)駕駛?cè)斯ぶ悄芴幚砥?,我們有很多思想借鑒到我們對(duì)大腦的理解。但是這些想法,我們針對(duì)這個(gè)場(chǎng)景去做專門的優(yōu)化而不是做通用的問題,我們能夠極大提升我們對(duì)這件事情的處理能力,在自動(dòng)駕駛里面反映的就是足夠的安全,足夠的可靠。
他接著說道,還有一個(gè)趨勢(shì)是計(jì)算,我們考慮到計(jì)算也像天下大事一樣分久必合,合久必分,由移動(dòng)互聯(lián)網(wǎng)不斷地中心發(fā)展,到現(xiàn)在云計(jì)算。從2017年開始,我們會(huì)看到另外一個(gè)趨勢(shì),就是很多很多的計(jì)算不斷的往終端跑,自動(dòng)駕駛就非常本質(zhì),我們?cè)谥v智能網(wǎng)聯(lián),包括像百度跟谷歌的自動(dòng)駕駛都依賴于高精度地圖,但是我個(gè)人認(rèn)為自動(dòng)駕駛的安全性的本質(zhì)屬性決定了,我們一定要讓汽車在不聯(lián)網(wǎng)的情況下面充分地安全、足夠地安全。
在整個(gè)云計(jì)算互聯(lián)網(wǎng)邊緣節(jié)點(diǎn)上面去做本地計(jì)算是對(duì)自動(dòng)駕駛非常重要的。中國(guó)的交通出行實(shí)際上是邊緣計(jì)算,是世界邊緣計(jì)算第一大場(chǎng)景。去年中國(guó)賣出了2800萬輛車,美國(guó)是1700萬輛,我們是毫無爭(zhēng)議汽車銷售大國(guó),你很難找到像汽車對(duì)于海量數(shù)據(jù)的處理以及實(shí)時(shí)性要求這么高。我們知道一輛汽車對(duì)于自動(dòng)駕駛每天會(huì)處理4-10到TB的數(shù)據(jù),幾千輛車比整個(gè)百度檢索的量還要大,在自動(dòng)駕駛這個(gè)邊緣技術(shù),中國(guó)交通出行是全球邊緣計(jì)算第一大場(chǎng)景。
他指出,我們?cè)谒伎技夹g(shù)的三大支點(diǎn),從算法出發(fā),去思考怎么樣設(shè)計(jì)這樣的處理器和架構(gòu),怎么使得它充分支撐它在本地的計(jì)算,要求我們?nèi)臼剿伎家粋€(gè)問題,不僅僅是軟件或者硬件,包括軟件和硬件的協(xié)同,包括系統(tǒng)軟件包括云計(jì)算。
人工智能對(duì)自動(dòng)駕駛非常重要,第一個(gè)是透明可追溯。整個(gè)軟件系統(tǒng)透明性是非常非常重要的,如果有原因的話,如果出了什么事情一定要能夠理解它然后加以控制。其他的包括端到端的學(xué)習(xí),傳統(tǒng)的人工智能系統(tǒng)都是訓(xùn)練的,但是未來得人工智能系統(tǒng)都是學(xué)習(xí)的,所以訓(xùn)練跟學(xué)習(xí)是兩回事。它基本上就是一個(gè)灌輸式的學(xué)習(xí),其實(shí)人都是這樣的。
還有一個(gè)就是硬件的友好,軟件系統(tǒng)的硬件友好,這是通常做人工智能系統(tǒng)或者做軟件的人不太關(guān)注的,在汽車方面因?yàn)樯婕暗秸麄€(gè)性能、延時(shí)功耗和可靠性,需要軟件和硬件高度配合。我們的設(shè)計(jì)思路,首先思考軟件,思考軟件同時(shí)我們做硬件,我們不做通用的神經(jīng)網(wǎng)絡(luò)處理器的設(shè)計(jì),因?yàn)槲覀冇X得自動(dòng)駕駛這樣一件事情足夠難,我們把它計(jì)算平臺(tái)設(shè)計(jì)得通用,會(huì)使它的效率并不足夠高。在明年1月份,在拉斯維加斯地平線會(huì)向外界介紹我們第二代處理器的架構(gòu),這是一個(gè)核心像素級(jí)的圖象處理設(shè)備。像素級(jí)的處理更加細(xì)節(jié),它更加準(zhǔn)確更加精確,這里面包括馬路牙子,電線桿都處理過,包括背后有遮擋的行人、車邊界更加的精確。
他分享道,我們跟德國(guó)人交流,德國(guó)覺得中國(guó)的自動(dòng)駕駛幾乎是不可能的,因?yàn)樗麄冞B人都不敢開車,我們慢慢慢慢走,這個(gè)其實(shí)是非常細(xì)的細(xì)節(jié),我們開上四環(huán),這些桿子也很重要,我們知道什么是移動(dòng)、什么是不變,這個(gè)就對(duì)你的定位非常重要?;谶@樣我們的處理器,同時(shí)處理四路視頻,我們把什么地方是柱子、什么是停車位我們都實(shí)時(shí)找出來。駕駛自動(dòng)感知預(yù)測(cè)這個(gè)維度比我們現(xiàn)在思考的要復(fù)雜,這個(gè)對(duì)計(jì)算要求非常非常高。
地平線在支撐共享出行智能代客泊車。實(shí)際上你的自動(dòng)駕駛剛需并不是人在車上,而是當(dāng)人不用車時(shí),你到了目的地、下車,你希望這個(gè)車自主的停車而不是你去停車,這個(gè)車的續(xù)航只有100多公里,它需要自主充電,它需要自主接下一個(gè)客人……這種情況下大規(guī)模的提高效率,但是同時(shí)它所應(yīng)對(duì)的場(chǎng)景沒有那么復(fù)雜,因?yàn)樗灰退倬蛪蛄?,這種場(chǎng)景下面實(shí)際上我倒是覺得它可能比乘用車最先的去實(shí)現(xiàn),那么我們的設(shè)計(jì)思路就是只依靠視覺來做這個(gè)事情。
基本上我們的思考,地平線的商業(yè)定位我們只做賦能的賦能者,我們自己不會(huì)去做車,我們自己不會(huì)去做運(yùn)營(yíng),我們的想法就是心無旁鶩的去打造處理器平臺(tái),然后去賦能我們的OEM。我們很多的創(chuàng)業(yè)公司,科研院所希望做底層的支撐性的平臺(tái),所以地平線的核心想法是做一個(gè)技術(shù)平臺(tái)的供應(yīng)商,因?yàn)槲磥碚麄€(gè)產(chǎn)業(yè)的生態(tài)需要各種不同的玩家。