Kinect創(chuàng)新潮
真正偉大的創(chuàng)新,將會(huì)決定很長一段時(shí)間人類改變世界的方式,比如蒸汽機(jī)或計(jì)算機(jī),而Kinect在這一視角下,幾乎必然會(huì)成為一種關(guān)鍵力量。
微軟公司首席研究官里克·雷斯特安靜地坐在記者面前,溫文爾雅,與他實(shí)際的身份相比,看起來更像是一個(gè)在大學(xué)呆了許久的教授。開始采訪后,沒想到我們第一個(gè)話題并不是關(guān)于微軟,也不是關(guān)于計(jì)算機(jī)或互聯(lián)網(wǎng),而是蒸汽機(jī)。
整個(gè)社會(huì)每隔幾十年或上百年,就會(huì)出現(xiàn)一次比較大的創(chuàng)新,可是這樣的創(chuàng)新會(huì)給世界帶來多大的影響呢?“你要了解這一點(diǎn),最好的方法是去倫敦的大英科學(xué)博物館參觀,去看看里面那些個(gè)頭巨大的蒸汽機(jī)展品。”里克說。
16世紀(jì)到17世紀(jì),蒸汽機(jī)的出現(xiàn)和不斷改良對(duì)英國社會(huì)和全世界產(chǎn)生了巨大的影響。曾幾何時(shí),蒸汽機(jī)是一切問題的答案——無論你想建造任何事物,或者開展任何工程,都可以通過設(shè)計(jì),讓蒸汽機(jī)來完成。
這是真正偉大創(chuàng)新的力量,它決定了之后很長一段時(shí)間人類改變世界的方法。而我們現(xiàn)在正在經(jīng)歷的或許與之相仿,只不過不是由蒸汽機(jī)、而是計(jì)算機(jī)所驅(qū)動(dòng)的創(chuàng)新時(shí)代。如果說蒸汽機(jī)決定了人們改造和創(chuàng)造世界的方法,則計(jì)算機(jī)更多地為人類觀察和了解世界提供了一種方法論,從廣袤的宇宙到微小的細(xì)胞,乃至人與人的組織形態(tài)。
如果說人的進(jìn)化在于對(duì)工具使用的不斷升級(jí),則我們正在面臨一個(gè)工具再次革新的時(shí)代。在這樣的背景下,Kinect正在通過對(duì)人機(jī)交互的改變,提供一種關(guān)鍵力量。
Kinect超現(xiàn)實(shí)世界
恰逢微軟研究院20周年,記者有機(jī)會(huì)在西雅圖參加了“微軟技術(shù)節(jié)”(TechFest)的公開部分。雖然不能獲知各種技術(shù)將如何與產(chǎn)品結(jié)合的進(jìn)一步細(xì)節(jié),但所看到的技術(shù)已經(jīng)讓人大為驚訝。走進(jìn)展廳,密密麻麻的技術(shù)展示讓人仿佛置身于科幻世界,其中大部分技術(shù)已經(jīng)有了相當(dāng)強(qiáng)的應(yīng)用場景展示——如果它們真能應(yīng)用到現(xiàn)實(shí)社會(huì)中,無疑將刮起一陣科技風(fēng)暴。
Chris Harrison站在那里,他左邊肩膀上放著一個(gè)奇怪的裝置,那是一個(gè)微型Kinect和投影儀的組合。這個(gè)來自微軟雷德蒙研究院的小伙子笑了笑,向前伸出了自己的左手,只見一片光打下,手中出現(xiàn)了一個(gè)Windows Phone的投影。
可這不只是投影而已,他用右手開始點(diǎn)擊投影出的手機(jī),一切開始運(yùn)轉(zhuǎn),這個(gè)虛擬手機(jī)用起來和真實(shí)的手機(jī)一模一樣。他嘗試打了個(gè)電話,又打開相簿,偏了偏肩膀,圖片開始在墻上更大的區(qū)域展示。
這玩意兒有個(gè)一看就懂的名字,“可穿著的多點(diǎn)觸控交互”,是他正在研究的技術(shù),能在生活中常見的表面上實(shí)現(xiàn)交互式多點(diǎn)觸控應(yīng)用。它不需要任何校準(zhǔn)就可以提供類似鼠標(biāo)或觸摸屏的功能,不止如此,還能輕易識(shí)別手指在懸空狀態(tài)下的指令,與2D的觸摸屏相比,變成了一個(gè)“觸摸空間”。
看似簡單的搭配:Kinect識(shí)別動(dòng)作、投影儀展示、用云計(jì)算處理信息,卻產(chǎn)生了遠(yuǎn)遠(yuǎn)超過現(xiàn)有觸摸交互的效果。通過距離判定,它還能進(jìn)行身份判定,只識(shí)別使用者手指所進(jìn)行的操作。想想看,與現(xiàn)在帶個(gè)手機(jī)或平板相比,未來每個(gè)人可能只需要攜帶一個(gè)巴掌大小的裝備就夠了。
比這個(gè)更有趣的是Harrison的同事Hrvoje Benko所展示的Beamatron技術(shù)。他手拿一個(gè)像玩具汽車操縱桿的玩意兒,在地上控制一輛投影出來的虛擬汽車。汽車在現(xiàn)實(shí)中的房間地板上行駛,碰到斜坡或墻壁,還能自己上下坡和遇到碰撞時(shí)產(chǎn)生反應(yīng),和一輛真正的玩具車差不了多少。
它的實(shí)現(xiàn)原理和之前類似,可應(yīng)用的場景嚴(yán)格來說歸于“增強(qiáng)現(xiàn)實(shí)”類,實(shí)現(xiàn)了相當(dāng)有趣的虛擬圖層和現(xiàn)實(shí)的交互,并能根據(jù)指令產(chǎn)生不同的反饋。讓虛擬的人或物在一片現(xiàn)實(shí)的障礙中穿行,這提供了很大的想象空間,不只是在未來的娛樂領(lǐng)域。比如,根據(jù)人在客廳里的行動(dòng),自動(dòng)把他所收到的新郵件或者新短信放到他的視野范圍內(nèi),這樣就不會(huì)錯(cuò)過任何一個(gè)信息了。
幾乎每一個(gè)技術(shù)都能引發(fā)無盡的想象。在一個(gè)角落的展臺(tái)上,記者看到了一副真實(shí)的“機(jī)器人之眼”。它由兩個(gè)Kinect所組成,模仿人的眼睛向外觀察事物,并且遠(yuǎn)程連接到用戶面前。你的面前會(huì)展現(xiàn)出機(jī)器眼睛所看到的場景,它是3D的,并且會(huì)隨著你頭的轉(zhuǎn)動(dòng)來調(diào)換場景。這可真是“足不出戶知天下”了。
而在它不遠(yuǎn)處,有個(gè)名為IllumiShare的分享技術(shù),很多人圍繞在它周圍。這是個(gè)看起來像臺(tái)燈的裝置,它提供了一個(gè)共享的方形平臺(tái),利用Kinect的捕捉能力,能讓身處不同空間的兩個(gè)人在同一個(gè)平臺(tái)上畫畫或展示物品,效果相當(dāng)驚人。據(jù)技術(shù)研究者、來自微軟印度研究院的Sasa Junuzovic介紹,要實(shí)現(xiàn)這樣的效果成本并不高,商用起來很方便。
這一切讓人眼花繚亂。事實(shí)上現(xiàn)場還有很多很酷的技術(shù),幾乎所有最熱的名詞如增強(qiáng)現(xiàn)實(shí)、裸眼3D、動(dòng)態(tài)捕捉、近場交互、實(shí)時(shí)翻譯,都能在這里找到正在不斷研究且進(jìn)展很快的技術(shù)真身,比如當(dāng)你口述一段中文,機(jī)器自動(dòng)將它變成和你口音一模一樣的意大利語;又或者你能用手指非常簡單地取代鼠標(biāo),精確在空中完成對(duì)電腦的操作。
但其中最耀眼的明星仍是Kinect。這個(gè)已經(jīng)在微軟Xbox游戲機(jī)中得以商用的、價(jià)格低廉的裝置正在引爆更大的想象空間,并激發(fā)了微軟全球各個(gè)研究院中技術(shù)開發(fā)者們?nèi)ヒ运鼮榛A(chǔ)實(shí)現(xiàn)更深層、更具體的技術(shù)創(chuàng)新。記者詢問了許多新技術(shù)的開始時(shí)間,它們很大一部分都是開始于近兩三年內(nèi),那正是Kinect在游戲玩家中最初流行的時(shí)候。
其實(shí),Kinect本身的實(shí)現(xiàn)原理并沒有那么復(fù)雜,但它成功地用一種更自然的方式實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界中尤其是人的動(dòng)作捕捉。其意義在于,它讓計(jì)算機(jī)有了更準(zhǔn)確有效的“眼睛”去觀察這個(gè)世界,并根據(jù)人的動(dòng)作來完成各種指令。
方腦袋的機(jī)器人
“我覺得我們已經(jīng)進(jìn)入了這樣一個(gè)時(shí)代:計(jì)算機(jī)漸漸擁有了能夠與人類相媲美的能力——它們能看到、聽到、觸摸、感覺、了解我們所處的地點(diǎn)和感知運(yùn)動(dòng)狀態(tài)。我們逐漸賦予了計(jì)算機(jī)這些能力,并用它開辟出巨大的用武之地。”里克說,“我們已經(jīng)取得了不錯(cuò)的進(jìn)展,比如Kinect這種相對(duì)廉價(jià)的裝置,能看到你的運(yùn)動(dòng)并識(shí)別動(dòng)作,并利用這些信息來控制用戶界面。”
有意思的是,即便在技術(shù)研究界,大家也對(duì)Kinect如此管用感到很意外和驚訝,它開創(chuàng)了一個(gè)全新的研究領(lǐng)域,所有人都會(huì)想:“我們可以用Kinect來干點(diǎn)別的什么呢?”
而微軟做的事情是順?biāo)浦邸T诓痪弥?,微軟發(fā)布了Kinect的Windows SDK套件,允許全世界對(duì)此有興趣的人基于Windows操作系統(tǒng)來挖掘Kinect的可能性,目前其下載量已經(jīng)十分巨大。還記得Kinect剛發(fā)布時(shí)的標(biāo)語,“身體就是控制器”,很多初創(chuàng)企業(yè)在這種新的人機(jī)交互方式中發(fā)現(xiàn)了蘊(yùn)藏的機(jī)會(huì)。
微軟研究院自己自然首當(dāng)其沖。里克舉了一個(gè)例子,當(dāng)醫(yī)生在做手術(shù)時(shí),他很多時(shí)候需要查詢關(guān)于病人的信息,比如在動(dòng)作空間很小的血管手術(shù)里查看關(guān)鍵脈絡(luò),可他們因?yàn)樾l(wèi)生原因,又無法在手術(shù)狀態(tài)下用任何觸摸來完成信息的檢索。而現(xiàn)在利用Kinect,醫(yī)生完全可以實(shí)現(xiàn)這一點(diǎn)。
在人眼無法看到東西的暗處,Kinect也有妙用。它能通過紅外攝像頭“看到”事物,并且根據(jù)人的動(dòng)作,經(jīng)由不同聲音的播放來對(duì)人進(jìn)行提醒。這種方式對(duì)盲人格外有效。
在卡內(nèi)基梅隆大學(xué),人們正在用Kinect攝像頭來控制機(jī)器人,讓機(jī)器人自己獨(dú)立走遍新落成的計(jì)算機(jī)系大樓。機(jī)器人能看到來往的人并及時(shí)避讓,還會(huì)道歉。機(jī)器人會(huì)使用電梯——機(jī)器人不一定會(huì)操控電梯,但是它可以等候其他人到來,并請求別人幫助它進(jìn)行相應(yīng)的操作。據(jù)說這臺(tái)機(jī)器人行動(dòng)很快,不像傳統(tǒng)大家看到的機(jī)器人那么緩緩挪動(dòng)。
里克最近還看到一項(xiàng)演示,一家公司正在研究如何將Kinect攝像頭用在超市購物車上,這樣購物車就可以自動(dòng)地跟隨人們逛店購物。把商品放進(jìn)購物車時(shí),它會(huì)自動(dòng)通過攝像頭掃描,知道你所購買的是什么,并且在整個(gè)購物過程中提供協(xié)助。
Kinect與計(jì)算機(jī)的未來
正如無數(shù)科幻影片里所看到的,“機(jī)器人時(shí)代”正在到來,只不過它并非以擬人的方式存在,而是以計(jì)算機(jī)的形態(tài)出現(xiàn)在人們周圍。它們通過攝像頭來“看”,通過麥克風(fēng)來“聽”,一連串的語音分析技術(shù)和算法正在讓它聽得更智能;還有觸摸和了解,微軟等公司的大數(shù)據(jù)計(jì)算分析技術(shù)正在為“機(jī)器人”構(gòu)建越來越智慧和豐富的“大腦”。
而Kinect正是讓“機(jī)器人”的眼睛升級(jí)的過程,由此激發(fā)的各種應(yīng)用場景下的創(chuàng)新,則是由眼睛連接到“大腦”并給予反饋的方式。
“這雙眼睛”本身也在不斷完善。微軟亞洲研究院的趙春水和顧嘉唯為記者演示了“支持手勢識(shí)別的下一代網(wǎng)絡(luò)攝像頭”,這簡直就是一個(gè)活生生的最適合PC電腦場景下的寶貝。
與Kinect相比,它距離更近、實(shí)現(xiàn)更精確、視野更廣,能夠捕捉“雙目”立體視頻和高精度圖像,比如人臉的細(xì)節(jié)甚至是指紋。這意味著什么?我們可以用比《少數(shù)派報(bào)告》中湯姆·克魯斯更酷的方式來操控我們的信息,我們可以用更個(gè)性化的指紋或面部識(shí)別方式來管理我們的身份,甚至還有與過去“鼠標(biāo)+鍵盤”時(shí)代完全不同的使用軟件和互聯(lián)網(wǎng)的方式。
未來,你很有可能只需要做一個(gè)打響指的動(dòng)作就開啟QQ,或者翹起大拇指來刷新微博。與很多行業(yè)應(yīng)用相比,這股Kinect引發(fā)的創(chuàng)新潮流將會(huì)在未來10年對(duì)大眾與社會(huì)產(chǎn)生深刻的影響。
“回頭看70年前,有些體力勞動(dòng)是非常艱難的。我看過一篇20世紀(jì)20年代的文章,當(dāng)時(shí)的人們盼望著結(jié)束每天工作16小時(shí)的生活。人們的工作時(shí)間很長、強(qiáng)度很大,壽命卻很短。”里克說,“現(xiàn)在人們有越來越多閑暇時(shí)間,能夠以更高效率完成工作,并且還有更多自我實(shí)現(xiàn)的機(jī)會(huì)。我想如果沒有計(jì)算機(jī),很多事情不會(huì)如此變好。”
通過Kinect,我們看到了在人類改變世界中更大的可能性,與此同時(shí),計(jì)算機(jī)逐漸可以被人以一種更加簡單的方式去使用與控制。未來可能再也不用學(xué)輸入法、編程甚至是外語,我們天生就可以和任何計(jì)算機(jī)、任何人對(duì)話,以我們最自然的方式。