眼睛“控制”世界 新的人機(jī)交互方式[圖]
微軟的游戲操控設(shè)備 Kinect 有一句廣告語(yǔ):You are the controller(你就是遙控器)。通過 Kinect,普通人不需要使用任何手柄、搖桿、鼠標(biāo)或者其他遙控器就能操控游戲,這讓 Kinect 遠(yuǎn)遠(yuǎn)超越了普通家用游戲機(jī)的段位。事實(shí)是,人們也沒有把它僅僅當(dāng)成游戲機(jī),無數(shù)黑客對(duì)其進(jìn)行破解,開發(fā)出一系列創(chuàng)新發(fā)明,有模擬光劍道具,也有自動(dòng)跟著垃圾跑的垃圾桶,甚至英國(guó)一所大學(xué)正在基于它研發(fā)一種技術(shù)幫助中風(fēng)患者恢復(fù)健康。
新的人機(jī)交互方式讓計(jì)算機(jī)能讀懂人所傳遞的命令?,F(xiàn)在,眼睛是人們開發(fā)的下一個(gè)目標(biāo)去年底,丹麥公司 Senseye 發(fā)布了一個(gè)視頻。
視頻里,一個(gè)人捧著平板電腦在玩“切水果”的游戲不過,他沒有動(dòng)一根手指,而是完全用眼神控制。后來,這家由四個(gè)丹麥博士生創(chuàng)立的公司改名為“The Eye Tribe”,他們開發(fā)的眼控技術(shù)能通過智能手機(jī)或者平板電腦的前置攝像頭獲取圖像,利用計(jì)算機(jī)視覺算法進(jìn)行分析。軟件能定位眼睛的位置,估計(jì)你正在看屏幕的什么地方,甚至精確到非常小的圖標(biāo)。這項(xiàng)眼控技術(shù)能夠取代手指,控制平板電腦或手機(jī)。據(jù)國(guó)外媒體報(bào)道,他們已經(jīng)開始與手機(jī)制造商和運(yùn)營(yíng)商進(jìn)行合作,希望明年能將正式產(chǎn)品推向市場(chǎng)。
除了用眼神控制手機(jī),用眼睛操控的概念筆記本、眼控相機(jī)等產(chǎn)品也已面世。以眼神的移動(dòng)軌跡為基礎(chǔ)進(jìn)行的人機(jī)交互方式,是繼 Kinect 之后人機(jī)交互界面的又一次革命。
眼睛上的實(shí)驗(yàn)
17 世紀(jì)初,人們就開始研究眼睛的運(yùn)動(dòng)。1879 年,法國(guó)人路易斯·艾米·賈維爾觀察到,人們的眼睛在閱讀文字時(shí),并非像之前猜想的是平滑地一行行掃射,而是每隔幾個(gè)字就會(huì)有短暫的視覺停留。
于是人們很好奇:閱讀時(shí),眼睛會(huì)停留在哪些字上?停留多長(zhǎng)時(shí)間?
為了研究這個(gè)問題,埃德蒙·休伊做出世界上第一個(gè)眼睛追蹤器:一個(gè)有洞的隱形眼鏡,和一個(gè)會(huì)根據(jù)眼睛活動(dòng)擺動(dòng)指針的鋁制指示器相連。但這個(gè)追蹤器因?yàn)橐脱矍蚪佑|,對(duì)眼睛的干擾比較大。另一個(gè)芝加哥的家伙托馬斯·巴斯維爾轉(zhuǎn)換了思路,做出了一個(gè)非接觸式的追蹤器,他利用光束照射眼睛,通過在電影膠片上記錄眼睛反射的光記錄眼睛的活動(dòng)軌跡。他用這個(gè)裝置研究人們閱讀和觀看圖片的行為習(xí)慣。
到了 1980 年,眼睛追蹤器被用來研究和人機(jī)交互有關(guān)的問題;比如,研究人員很好奇用戶如何在電腦菜單中搜索命令。最近幾年,人們?cè)絹碓蕉噙\(yùn)用眼部追蹤器研究用戶如何和不同的計(jì)算機(jī)界面互動(dòng),結(jié)果往往能改變界面的設(shè)計(jì)。其他的研究包括用戶如何對(duì)待下拉菜單,他們通常將注意力集中在網(wǎng)站的什么位置,開發(fā)人員就會(huì)知道該在哪里設(shè)計(jì)廣告位。
隨著眼控技術(shù)的發(fā)展,和人類對(duì)視覺生理及心理的了解,基于人類視覺系統(tǒng)(Human Vision System, 簡(jiǎn)稱“HVS”)的凝視繪制技術(shù)也逐漸成為圖形學(xué)的研究熱點(diǎn)。這種技術(shù)通過略去不為用戶感知的畫面區(qū)域的圖像細(xì)節(jié)來提高圖像的繪制和顯示效率。
在研究中,人們普遍達(dá)成的共識(shí)是,“注意力”和眼睛看在哪并不統(tǒng)一,前者總是比眼睛要領(lǐng)先大約 100-250 微秒;也就是說,人的注意力轉(zhuǎn)移到新的位置 100-250 微秒后,眼睛才會(huì)跟隨其后。
在技術(shù)上,眼控技術(shù)已經(jīng)相當(dāng)成熟,在工業(yè)控制、機(jī)器人學(xué)和臨床醫(yī)學(xué)領(lǐng)域都有應(yīng)用,只是還沒有應(yīng)用到消費(fèi)領(lǐng)域。它是基于角膜反射原理,通過光在用戶眼睛角膜上形成高亮度反射點(diǎn)作為參考點(diǎn),當(dāng)眼球轉(zhuǎn)動(dòng)注視屏幕上不同位置時(shí),由于眼球近似為球體,光斑不動(dòng),瞳孔相對(duì)光斑發(fā)生偏移,利用瞳孔中心和光斑的位置關(guān)系就能確定視線方向。目前運(yùn)用最廣泛的設(shè)計(jì)是以視頻為基礎(chǔ)的眼睛追蹤器。一個(gè)設(shè)想鏡頭聚焦在一只或一雙眼睛上,在觀眾受到某種刺激時(shí)記錄它們的變動(dòng)。眼控技術(shù)的核心是算法,如何讓系統(tǒng)迅速準(zhǔn)確地“學(xué)習(xí)”人眼睛的各種行為,這是個(gè)挑戰(zhàn)。
EyePhone
EyePhone 應(yīng)該翻譯成“眼機(jī)”或者“目機(jī)”?似乎都不太好聽。在大觸屏手機(jī)廣泛流行之前,有人就開始研究如何用眼睛控制手機(jī)了。
美國(guó)達(dá)特茅斯學(xué)院(Dartmouth College)就有一支眼控手機(jī)的研發(fā)團(tuán)隊(duì),他們?cè)噲D創(chuàng)造一套眼睛追蹤系統(tǒng),開發(fā)以眼睛來控制手機(jī)的操作方法。
讓眼睛追蹤系統(tǒng)運(yùn)用到操作系統(tǒng)里,重要的是設(shè)計(jì)一套能夠?qū)崿F(xiàn)的軟件。首先,你需要校準(zhǔn)這個(gè)系統(tǒng),在室內(nèi)室外不同光線下盯著同一張圖片看,讓軟件學(xué)習(xí)、識(shí)別你的眼睛在不同光照條件下的運(yùn)動(dòng)。他們?cè)谥Z基亞 N810 上做了試驗(yàn),設(shè)計(jì)出一個(gè)初始“眼菜單”,屏幕被分為9格,分別對(duì)應(yīng)郵件、接電話、拍照片、日歷、短信等不同功能。當(dāng)一個(gè)人盯著某一塊區(qū)域看時(shí),某一個(gè)功能區(qū)域就被激活高亮顯示,一眨眼,這個(gè)功能就被激活。
根據(jù)《麻省理工科技評(píng)論》雜志 2010 年的報(bào)道,眼控式手機(jī)的技術(shù)研發(fā)已經(jīng)數(shù)年。進(jìn)行這項(xiàng)技術(shù)開發(fā)的主要目的,是希望能讓手部殘疾的人克服無法使用電話的障礙。
在這項(xiàng)研究中,整個(gè)系統(tǒng)技術(shù)含量最高的部分就是自動(dòng)校正系統(tǒng),它需要算法優(yōu)化,提高光學(xué)采集精度,實(shí)現(xiàn)視線跟蹤,適應(yīng)外部環(huán)境光強(qiáng)度變化,判別眼睛睜、閉狀態(tài)等。帶領(lǐng)“EyePhone”研發(fā)團(tuán)隊(duì)的安德魯·坎貝爾(Andrew Campbel)教授認(rèn)為,眼控式手機(jī)解放了雙手,不僅僅是殘疾人,每個(gè)人都能享受到它帶來的極大便利。但靠眼神操作手機(jī),比在桌上的電腦執(zhí)行眼控指令更困難,因?yàn)槭褂谜吆褪謾C(jī)都是行動(dòng)中的物體,而周圍環(huán)境也是變幻莫測(cè),如何演算和辨識(shí)使用者在不同的狀態(tài)下所傳達(dá)的眼神收發(fā)訊號(hào),是最難解決的問題。
在 2011 年的 Cebit 展上,聯(lián)想和瑞典眼控技術(shù)公司 Tobbi 聯(lián)合發(fā)布了一款概念筆記本,特制的長(zhǎng)方形感應(yīng)器能夠追逐眼球的移動(dòng)軌跡,記錄數(shù)據(jù),電腦處理器把這些數(shù)據(jù)轉(zhuǎn)化為鼠標(biāo)控制,整個(gè)系統(tǒng)并不會(huì)讓眼控的過程感覺十分刻意,也不會(huì)像傳統(tǒng)的眼控系統(tǒng)一樣過于敏感或是過于駑鈍。
Tobii 公司成立于 2001 年,是一家專門研發(fā)眼動(dòng)追蹤和眼動(dòng)控制技術(shù)的公司。除了桌面眼動(dòng)電腦,他們也在研發(fā)一款具備眼控界面的 windows 平板電腦 C12,用戶可以轉(zhuǎn)動(dòng)眼珠來移動(dòng) C12 上的鼠標(biāo)指針,而眨眼則代表點(diǎn)擊。機(jī)器里設(shè)置了一個(gè)校準(zhǔn)界面,允許多個(gè)用戶定義眼控指令。
最近,一位英國(guó)皇家藝術(shù)學(xué)院的畢業(yè)生設(shè)計(jì)了一款用眼睛控制拍攝的概念相機(jī) Iris,整個(gè)相機(jī)就像一支鏡頭,你從鏡頭中取景,用眼睛對(duì)焦,張開/瞇起眼睛完成變焦,最后眨眼完成拍攝。
而本文開頭提到的那個(gè)丹麥公司“The Eye Tribe”已經(jīng)融到了一筆 80 萬美元的資金,用于他們的商業(yè)拓展。他們專門研究用于平板和手機(jī)系統(tǒng)的眼控技術(shù),開發(fā)了相應(yīng)的算法和軟件,團(tuán)隊(duì)中還有一位博士專門研究低成本眼控技術(shù)。“眼動(dòng)控制會(huì)成為智能手機(jī)、平板等手持設(shè)備交互界面的下一波潮流,谷歌眼鏡也很可能會(huì)用到這個(gè)技術(shù)。”公司的聯(lián)合創(chuàng)始人兼 CEO 蘇恩·約翰遜(Sune A Johnson)對(duì)媒體說,他們希望能站在潮流的頂端。
更多計(jì)算機(jī)與外設(shè)信息請(qǐng)關(guān)注:21ic計(jì)算機(jī)與外設(shè)頻道