從人類如何感知世界到機(jī)器人
我們好像剛剛經(jīng)歷了pc到移動(dòng)的互聯(lián)網(wǎng)革命,或許你還沒(méi)有完全適應(yīng),但現(xiàn)在機(jī)器人技術(shù)已經(jīng)是發(fā)展趨勢(shì)。
不管你信不信,下一個(gè)主要的革命將是機(jī)器人的崛起。或許用不了多久,我們會(huì)像離不開手機(jī)一樣離不開機(jī)器人。
考慮到機(jī)器人的發(fā)展速度,我們有必要理解它們的工作原理,就像我們理解電腦和手機(jī)一樣。
現(xiàn)在,盡管機(jī)器人技術(shù)是一個(gè)龐大的學(xué)科,但我們今天主要討論機(jī)器人的一個(gè)特殊方面——感知。
在我們解釋機(jī)器人感知的各種方式之前,讓我們先看看人類是如何感知世界的。
機(jī)器人和人類友好發(fā)展
人類感知世界
人類通過(guò)視覺(jué)、嗅覺(jué)、聽覺(jué)、味覺(jué)和觸覺(jué)這五種感官感知世界。雖然所有的感官都很重要,但主要的感官是視覺(jué)、聽覺(jué)和觸覺(jué)。
如果這些感官中少了一種,我們的生活將變得相當(dāng)困難。不過(guò)大多數(shù)人直到失去后,才知道這三種感覺(jué)的價(jià)值。
我們想象一下,即使是簡(jiǎn)單的事情,比如走在路上,聽到司機(jī)的喇叭聲,或者有人為了阻止你觸摸危險(xiǎn)物體而大喊大叫……
如果沒(méi)有你關(guān)鍵感官的功能和控制,你是很難做出反應(yīng)解除麻煩的。
我們還必須認(rèn)識(shí)到,感知不僅是每個(gè)感官的感知,而且是它們之間的無(wú)縫集成和處理,以連貫的方式感知來(lái)自你感官的信息輸入。
我們的大腦和脊髓主要控制感官的信息整合。讓我們以視覺(jué)為例,來(lái)理解感知的整合和處理。
我們知道,當(dāng)一個(gè)人看一個(gè)物體時(shí),這個(gè)物體會(huì)在視網(wǎng)膜上形成一個(gè)倒象。這張由光形成的圖像隨后被視網(wǎng)膜轉(zhuǎn)換成電信號(hào),并通過(guò)視神經(jīng)發(fā)送到大腦。
這個(gè)時(shí)候,物體再次倒換,從而使圖像直立。這有助于我們查看圖像,并為我們提供了物體本質(zhì)的細(xì)節(jié),包括它的尺寸和與我們的距離。
大自然的設(shè)計(jì)是原始的并且非常輝煌;要在機(jī)器人身上復(fù)制如此規(guī)模的設(shè)計(jì),需要全新的數(shù)學(xué)嚴(yán)謹(jǐn)性和紀(jì)律性。
眼球輸入信息
機(jī)器人圖像處理(視覺(jué))
正如圖像是在我們的眼球內(nèi)形成的,機(jī)器人也可以在相機(jī)的幫助下創(chuàng)建數(shù)字圖像。
數(shù)字圖像可以定義為二維圖像的表達(dá)形式,即有限的數(shù)字值集合,稱為圖像元素或像素。將圖像數(shù)字轉(zhuǎn)化為像素意味著圖像是實(shí)際圖像的近似。
像素值包含許多信息,如灰度、顏色、高度、不透明度等等。在計(jì)算機(jī)科學(xué)中,數(shù)字圖像處理是利用計(jì)算機(jī)算法對(duì)數(shù)字圖像進(jìn)行圖像處理。
數(shù)字圖像處理是作為數(shù)字信號(hào)處理的一個(gè)子范疇或領(lǐng)域,它與模擬圖像處理相比具有許多優(yōu)勢(shì)。
它允許更廣泛的算法應(yīng)用于輸入數(shù)據(jù),并可以幫助您避免在處理過(guò)程中產(chǎn)生的干擾和信號(hào)失真等問(wèn)題。
說(shuō)了十幾遍蘋果siri還沒(méi)有識(shí)別怪羅科普的語(yǔ)音
自然語(yǔ)言處理(聽覺(jué))
我們?nèi)祟惱斫庹Z(yǔ)言的方式是非常直觀的,但計(jì)算機(jī)在處理語(yǔ)言時(shí)采用了一種更合乎邏輯的方法。
自然語(yǔ)言處理(NLP)是計(jì)算機(jī)科學(xué)、信息工程和人工智能的一個(gè)子領(lǐng)域,研究計(jì)算機(jī)和人類語(yǔ)言之間的語(yǔ)言差異。
自然語(yǔ)言處理有兩種形式:基于規(guī)則的NLP和統(tǒng)計(jì)的NLP。
在NLP的早期,大多數(shù)處理都是基于手寫代碼。后來(lái),NLP轉(zhuǎn)向了更多的使用統(tǒng)計(jì)方法的機(jī)器學(xué)習(xí)范式。
機(jī)器人做家務(wù)
許多不同種類的機(jī)器學(xué)習(xí)算法已被應(yīng)用于自然語(yǔ)言處理中。這些算法采用從輸入數(shù)據(jù)生成的大量“特性”。(機(jī)器學(xué)習(xí)相關(guān),搜索下我們之前文章了解)
一些早期使用的算法,如決策樹,產(chǎn)生了硬“if-then”規(guī)則系統(tǒng),類似于當(dāng)時(shí)常見(jiàn)的手寫規(guī)則系統(tǒng)。
然而,越來(lái)越多的研究集中在統(tǒng)計(jì)模型上,這些模型基于為每個(gè)輸入特性附加實(shí)值權(quán)重來(lái)做出軟性概率決策。
這種模型的優(yōu)點(diǎn)是能夠表達(dá)許多不同的可能答案的相對(duì)確定性,而不是只有一個(gè),因此,當(dāng)將這種模型作為一個(gè)更大的系統(tǒng)組件包含進(jìn)來(lái)時(shí),就可以產(chǎn)生更可靠的結(jié)果。
好了,了解了這些之后,現(xiàn)在你應(yīng)該可以明白讓機(jī)器人理解它周圍的世界需要付出多大的努力!