沒(méi)有了深度學(xué)習(xí),機(jī)器人只是一堆廢鐵
事實(shí)上,在國(guó)內(nèi)人工智能還處于非常初級(jí)的階段。
昨天,網(wǎng)易發(fā)布的《2016全球人工智能發(fā)展報(bào)告》顯示,美國(guó)、英國(guó)和中國(guó)占有全球人工智能企業(yè)數(shù)量的65.73%,而中國(guó)以15745件專利居全球人工智能專利數(shù)排名第二。
從谷歌阿法狗大戰(zhàn)李世石到優(yōu)必選機(jī)器人春晚群舞,“人工智能”這個(gè)詞漸漸被大眾熟知,各種以機(jī)器人命名的公司、長(zhǎng)相各異的無(wú)人機(jī)和擺在商場(chǎng)里給孩子當(dāng)搖搖車玩的VR產(chǎn)品,給人描繪出一副好萊塢科幻式的烏托邦生活。
從本月12日開(kāi)始的雙創(chuàng)周活動(dòng),再次炒火了深圳的創(chuàng)業(yè)文化,庫(kù)克也專程趕來(lái),你們的深圳又在朋友圈刷屏了:“深圳再次吸引了世界的眼光”、“世界上最聰明的頭腦都在趕往深圳”好像要告訴全世界,這才是宇宙的中心。
這兩天借著參展機(jī)會(huì),去主會(huì)場(chǎng)溜達(dá)兩天。不出所料,現(xiàn)場(chǎng)展出最多的產(chǎn)品是機(jī)器人、無(wú)人機(jī)和AR/VR眼鏡。從外觀上看,似乎這些產(chǎn)品都很酷炫,為了搞清行業(yè)發(fā)展水平并找出幾家能讓人驚叫的產(chǎn)品,我挨個(gè)跟人請(qǐng)教了各家產(chǎn)品的性能和產(chǎn)業(yè)化方向。
得出的結(jié)論是,好像沒(méi)你們說(shuō)的那么牛逼啊。。。
我看見(jiàn)的更多是三五歲小童把玩唱《小蘋(píng)果》的“小曼”愛(ài)不釋手——比不會(huì)唱歌的玩具挖掘機(jī)好玩多了;也看見(jiàn)當(dāng)時(shí)火爆一時(shí)的送餐機(jī)器人,不知道她怎么在現(xiàn)如今狹小餐廳里穿梭的;還看見(jiàn)被觀眾團(tuán)團(tuán)圍住巡邏機(jī)器人“小明”無(wú)法避障,左右為難,當(dāng)我問(wèn)旁邊技術(shù)員,巡邏機(jī)器人如何識(shí)別小偷和業(yè)主時(shí),他笑著對(duì)我呵呵。
眾所周知,人工智能的核心是機(jī)器學(xué)習(xí),當(dāng)然現(xiàn)在更主流的是深度學(xué)習(xí),通過(guò)數(shù)據(jù)訓(xùn)練出模型,并使用模型發(fā)出預(yù)測(cè)。這是機(jī)器的基本“教化”原理。借助海量大數(shù)據(jù)對(duì)其進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,讓一坨冰冷的金屬或塑料具備了智慧,說(shuō)起來(lái)挺爽的,那么問(wèn)題就來(lái)了,這里面涉及到三個(gè)層面的問(wèn)題。
首先,什么是大數(shù)據(jù)?哪些大數(shù)據(jù)有利用價(jià)值?如何對(duì)這些大數(shù)據(jù)進(jìn)行分揀處理?我們需要把什么東西塞進(jìn)機(jī)器人大腦?這是人工智能的前提吧,如果沒(méi)有運(yùn)營(yíng)商海量的四川話、弗蘭話等各式方言的大數(shù)據(jù)庫(kù)供給,科大訊飛的語(yǔ)音識(shí)別還如何識(shí)別?只聽(tīng)得懂普通話的機(jī)器人“小萌”如何能聽(tīng)得懂說(shuō)河南話的主人。
其次,機(jī)器如何獲取指令?這就涉及到人機(jī)交互這樣老生常談的一個(gè)問(wèn)題了。常用的有語(yǔ)音識(shí)別、圖像識(shí)別以及文字識(shí)別,機(jī)器通過(guò)識(shí)別語(yǔ)音、圖像或者文字來(lái)對(duì)計(jì)算中樞發(fā)出計(jì)算指令。有人會(huì)說(shuō),這很簡(jiǎn)單啊,就是說(shuō)句話讓它能聽(tīng)懂唄!其實(shí)并不那么簡(jiǎn)單,單拿中文來(lái)說(shuō),整個(gè)中國(guó)有不下上百種方言吧,沒(méi)種方言發(fā)音標(biāo)準(zhǔn)不一樣吧,每個(gè)人的吐字不一樣清晰吧,要讓他聽(tīng)懂,其實(shí)很難,不是一般的難!
當(dāng)然,最后還得說(shuō)說(shuō)最核心的模型搭建或者叫網(wǎng)絡(luò)神經(jīng)訓(xùn)練。神經(jīng)訓(xùn)練就是讓機(jī)器得到指令后,經(jīng)過(guò)計(jì)算得出結(jié)果,并輸出指令的過(guò)程。高中數(shù)學(xué)老師老教我們,如果A=1,則……;如果A=2,則……,這種根據(jù)變量得出不同結(jié)果的模型是最基礎(chǔ)的算法。
舉個(gè)栗子,昨晚看完雙創(chuàng)展,在軟產(chǎn)工作的徒弟小何約我吃飯,這次她又遲到了。我把過(guò)往跟小何約飯的經(jīng)歷在腦海中重現(xiàn)一下,看看跟她約飯的次數(shù)中,遲到占了多大的比例。我利用這來(lái)預(yù)測(cè)她這次遲到的可能性。如果這個(gè)值超出了我心里的某個(gè)界限,那我選擇等一會(huì)再出發(fā)。假設(shè)我跟小何約過(guò)5次,她遲到的次數(shù)是1次,那么她按時(shí)到的比例為80%,80%是我跟她約飯的我是否按時(shí)出發(fā)的標(biāo)準(zhǔn)線,如果小何在5次遲到的次數(shù)中占了4次,也就是她按時(shí)到達(dá)的比例為20%,由于這個(gè)值低于我的紅線,因此我選擇推遲出門(mén)的時(shí)間。這種模型就是機(jī)器的靈魂,而算法也就當(dāng)然成了關(guān)鍵,所以做搜索引擎公司具有天然的算法優(yōu)勢(shì)、不管是特斯拉上的無(wú)人駕駛還是手機(jī)度娘界面上的新聞推送。
由各種人機(jī)交互識(shí)別技術(shù),對(duì)機(jī)器發(fā)出指令,機(jī)器根據(jù)已有的網(wǎng)絡(luò)神經(jīng)(計(jì)算模型)計(jì)算出一個(gè)結(jié)果,然后對(duì)機(jī)器硬件發(fā)出執(zhí)行指令,這是機(jī)器人工作的基本原理。
復(fù)習(xí)了一遍機(jī)器學(xué)習(xí)的基本原理后,反觀你們所展出的機(jī)器人,喊一聲“小花”——喚醒機(jī)器、唱首歌——錄制好的《小蘋(píng)果》就開(kāi)始唱了,巡邏機(jī)器人用得是攝像頭避障,后面沒(méi)有人臉圖像大數(shù)據(jù)庫(kù)支撐,捕捉到的數(shù)據(jù)將無(wú)從匹配,它就變成了一個(gè)移動(dòng)攝像機(jī)了,請(qǐng)問(wèn)現(xiàn)如今三步一臺(tái)階的小區(qū),“小花”如何給你巡邏呢?!
現(xiàn)在層出不窮的機(jī)器人,根據(jù)用途不同,大致可分為工業(yè)機(jī)器人、娛樂(lè)型機(jī)器人、陪伴型機(jī)器人還有保姆式機(jī)器人,除了工業(yè)機(jī)器人手臂能重復(fù)簡(jiǎn)單機(jī)械的工作,需要與人交互的機(jī)器人很難單獨(dú)達(dá)到功用,當(dāng)然很重要一方面是人很難對(duì)一個(gè)不完全智能的東西維持長(zhǎng)久的新鮮感,比如只會(huì)執(zhí)行唱歌、跳舞和簡(jiǎn)單對(duì)話機(jī)器人,你可能三天就會(huì)不再對(duì)她有興趣。
當(dāng)然,人工智能技術(shù)積累已經(jīng)到了窗口期,不管目前發(fā)展?fàn)顩r如何,前景是光明的。私以為,單就機(jī)器人來(lái)說(shuō),在目前的技術(shù)積累下,要大面積產(chǎn)業(yè)化還有些困難,唯一有希望的就是將目前人工智能技術(shù)與智能硬件的結(jié)合,不能全智能化的時(shí)候,我們將已有技術(shù)與現(xiàn)有硬件結(jié)合,提高現(xiàn)有硬件的各方面性能,是目前人工智能市場(chǎng)化的最好選擇。
拿駕駛來(lái)說(shuō),如果將計(jì)算機(jī)視覺(jué)技術(shù)與汽車結(jié)合,行駛在馬路上的汽車感應(yīng)到前方可能出現(xiàn)危險(xiǎn)時(shí),給駕駛員發(fā)出警示。或者語(yǔ)音識(shí)別植入到汽車控制中樞中,在高速行駛的汽車上,通過(guò)語(yǔ)音對(duì)汽車發(fā)出導(dǎo)航,這樣是不是更安全一些,當(dāng)然,很多汽車廠商已經(jīng)在這方面試水,有的已經(jīng)成熟,這也是人工智能目前產(chǎn)業(yè)化的一個(gè)范例。
《星球大戰(zhàn)》里面場(chǎng)景終會(huì)出現(xiàn),只不過(guò),現(xiàn)在說(shuō)“保姆式機(jī)器人”,我只能說(shuō):呵呵。