人機(jī)交互的未來——與虛擬角色進(jìn)行情感交流
▲ 圖片來自 2009 年電影 Avatar 的劇照
來自 TechnologyReview 的一篇題為《心理學(xué)家為虛擬角色發(fā)布情感需求的插件》的報(bào)道讓我們可以暢想未來的人機(jī)交互又將給我們帶來什么樣的驚喜。
1942 年 2 月世界上第一臺電子(電子管數(shù)字)計(jì)算機(jī) ENIAC 的出現(xiàn)就是為了能幫助人們從繁雜冗長的科學(xué)計(jì)算(比如計(jì)算彈道軌跡或飛行器的運(yùn)行軌跡等)中得到解脫,但由于受限于當(dāng)時(shí)的計(jì)算機(jī)硬件技術(shù)水平的發(fā)展(還沒有集成電路等微電子行業(yè)的誕生)計(jì)算機(jī)所能做到的事情還是很單一很局限。
電子計(jì)算機(jī)經(jīng)過四代的發(fā)展從原先極少數(shù)人能夠接觸到的大型機(jī)到現(xiàn)在早已成為人們?nèi)粘I畋夭豢缮俚膫€(gè)人機(jī)(或許 10 年前還算是奢侈品但如今早已成為必需品)。尤其是史蒂夫·喬布斯(Steve Jobs)和史蒂夫沃·茲尼亞克(Steve Wozniak)開創(chuàng)了個(gè)人計(jì)算機(jī)時(shí)代。但是只有計(jì)算機(jī)還不行,為了能讓計(jì)算機(jī)實(shí)現(xiàn)我們交給他的任務(wù),這就需要一種軟件平臺能夠與計(jì)算機(jī)進(jìn)行交互,以訪問和獲取計(jì)算機(jī)上相關(guān)的設(shè)備與資源(CPU、顯卡等),這樣操作系統(tǒng)就應(yīng)運(yùn)而生。之后大量的應(yīng)用軟件和游戲也是雨后春筍般的出現(xiàn)。
從某種意義上說,操作系統(tǒng)實(shí)現(xiàn)了各種計(jì)算資源的整合,實(shí)現(xiàn)了各種資源之間的相互調(diào)配與協(xié)作,這可以說是各種計(jì)算資源間的交互。但這樣的交互離不開人的早期或在過程中的參與,因?yàn)樘囟üδ艿膶?shí)現(xiàn)需要人們告訴計(jì)算機(jī)如何去做,大量的軟件工程人員和算法研究人員為此付出了巨大的努力。
人機(jī)交互,其方式簡單來說包括輸入方式與輸出方式。
對于輸入方式,早期的個(gè)人計(jì)算機(jī)是從控制計(jì)算機(jī)上的大量可控開關(guān)(Switches)開始的,比如著名的牛郎星 8800(Altair 8800)到了后來配備了鍵盤如 Apple I ,最讓人激動(dòng)人心的就是 1984 年 Macintosh (后簡稱 Mac)第一次將鼠標(biāo)設(shè)備作為一種輸入方式引入個(gè)人計(jì)算機(jī)。
對于輸出方式,從早期的紙帶打孔(其實(shí)也可以作為一種輸入方式)到后來的 CRT 顯示器,這些變化帶給我們的影響是顯而易見的,回想當(dāng)初老板說他們那個(gè)時(shí)代寫代碼和看結(jié)果都是在紙帶下完成的,這在今天的我們會感到是多么的無措。
當(dāng)然 Mac 帶給我們的不僅僅是在當(dāng)時(shí)看起來有多么新奇的鼠標(biāo),他也將枯燥的命令行界面用更加友好的圖形界面通過 CRT 向人們展示出來。這些造就了當(dāng)時(shí)全新的人機(jī)交互模式——鼠標(biāo)、鍵盤和通過 CRT 顯示出的圖形用戶界面 (GUI)。
我們后面將不再分開討論,因?yàn)槿藱C(jī)交互本身就是一個(gè)包含輸入和輸出的系統(tǒng),我們站在這個(gè)高度上來討論如今的人機(jī)交互給我們帶來了什么。
經(jīng)過了 20 多年的發(fā)展,顯示設(shè)備有了開創(chuàng)性的突破從 CRT 到 LCD,顯示技術(shù)也由 TN 升級到 IPS (之后還要加入銦鎵鋅氧化物 (IGZO)) 以及 AMOLED ,甚至柔性顯示技術(shù)等。顯示屏的尺寸種類也更加廣泛,大到 84 英寸的液晶電視小到索尼最新發(fā)布的頭戴式顯示器中 0.7 英寸的 OLED 顯示屏,各種大小的顯示屏涉及到我們生活的方方面面。
然而這些變化除了使體積改變 (追求更大或更?。┗蚬母突蝻@示效果更驚艷(色彩的還原或更高的 PPI 等)以外,帶給我們這些消費(fèi)者真正革命性震撼和影響的卻屈指可數(shù)。唯獨(dú) 2007 年蘋果公司發(fā)布了其第一款智能手機(jī) iPhone , 帶給我們革命性并具有深遠(yuǎn)影響的使用體驗(yàn)——觸控, 這就為人機(jī)交互領(lǐng)域帶來了濃墨重彩的一筆,有人說再這之前早有就電阻式觸摸屏,但其使用體驗(yàn)不如你用手指來的自然與友好。
這 20 多年來計(jì)算機(jī)硬件的發(fā)展,鼠標(biāo)和鍵盤一直伴隨其中,雖然外觀幾經(jīng)發(fā)生變化但基本的敲擊鍵盤、點(diǎn)擊鼠標(biāo)按鍵與滑動(dòng)鼠標(biāo)的操作一直未曾改變。當(dāng)然這種狀態(tài)還將維持相當(dāng)長的一段時(shí)間。這期間值得一提的變化是筆記本電腦的出現(xiàn)帶來了觸控板(當(dāng)然也有 IBM 著名的小紅帽指點(diǎn)桿)。期間也出現(xiàn)了攝像頭,其可以采集視頻信息或與朋友進(jìn)行視頻聊天,但這僅僅只作為一種旁支的輸入,本身不會與計(jì)算機(jī)產(chǎn)生互動(dòng)。
直到 2009 年 10 月 20 日蘋果發(fā)布了 Magic Mouse 第一次將觸控功能帶給了鼠標(biāo),這增加了我們?nèi)藱C(jī)交互時(shí)的樂趣,后來微軟也發(fā)布了 Touch Mouse。蘋果公司一直致力于更好的改善人機(jī)交互方式使其更自然更友好,其給 MacBook 的觸控板也帶去了新奇的體驗(yàn)甚至還單獨(dú)搞了一個(gè) Magic Trackpad 作為補(bǔ)充。這些產(chǎn)品的發(fā)布不僅給我們帶來了耳目一新的感官享受,更帶給我們在與計(jì)算機(jī)交互時(shí)更自然的體驗(yàn)。
在豐富了我們的手指文化后,人機(jī)交互又被微軟推向了另個(gè)一高潮。2010 年 6 月 14 日一個(gè)讓我們激動(dòng)萬分的深刻,微軟正式發(fā)布針對 Xbox 360 的體感外設(shè) Kinect ,這個(gè)小東西使我們的人機(jī)交互體驗(yàn)從手指上升到整個(gè)肢體,使用肢體語言來與計(jì)算設(shè)備交流。他不僅包括了日常普遍使用的 RGB 彩色攝像頭,還包括了由紅外線發(fā)射器與紅外線 CMOS 攝像頭構(gòu)成的 3D 結(jié)構(gòu)光深度感應(yīng)器,同時(shí)也有追焦技術(shù)與陣列式麥克風(fēng)。
這些復(fù)雜的軟硬件結(jié)合系統(tǒng)構(gòu)成了這個(gè)聰明的小家伙。在對用戶面部識別與肢體判斷中所使用到的技術(shù)涵蓋了機(jī)器學(xué)習(xí)、圖像處理與計(jì)算機(jī)視覺的相關(guān)領(lǐng)域??梢娖浔澈蟮膹?qiáng)大算法支撐起這個(gè)革命性的全新人際交互方式,這是那么自然、友好甚至更有趣。
而這篇《心理學(xué)家為虛擬角色發(fā)布情感需求的插件》的報(bào)道,讓我們對未來的人機(jī)交互變革又充滿了很多期待。文中談到,Paul Ekman 是美國的一位心理學(xué)家,在上世紀(jì) 70 年代,他和同事開發(fā)了一種方法來分類和評估人的面部表情。那時(shí)許多心里學(xué)家認(rèn)為人們的面部表情是從一種文化向另一種文化傳遞人們的具體情感變化。
通過 Ekman 的方法所獲得的針對全世界所有文化間人們面部表情的開創(chuàng)性數(shù)據(jù)庫,但是他們發(fā)現(xiàn)在所有文化間,人們針對六種基本的情感——生氣、恐懼、高興、驚喜、厭惡與悲傷都具有一樣的面部表情,也就是說面部表情的產(chǎn)生不存在不同文化間的傳遞。他們因此開發(fā)了名為面部行為編碼系統(tǒng) (Facial Action Coding System or FACS)的面部表情分類法,根據(jù)這個(gè)分類法能夠識別出每一種表情所對應(yīng)的面部肌肉的移動(dòng)。
這套系統(tǒng)不僅對心理學(xué)家研究情感在日常生活中的作用非常有用,而且完全可以挪用到虛擬世界中。FACS 可以用相對容易的方法直接為由計(jì)算機(jī)生成的虛擬人物提供真實(shí)的面部表情。這樣虛擬人物自然而然就具有了與真實(shí)人類相似的情感因素。但這需要建立一個(gè)標(biāo)準(zhǔn)的面部表情數(shù)據(jù)庫,如今 Delft 大學(xué)的人機(jī)交互系學(xué)者 Joost Broekens 及其同事就做了這樣的事情。他們實(shí)際上基于 FACS 創(chuàng)建了一個(gè)包含六種虛擬表情的數(shù)據(jù)庫,每一種表情就是一個(gè)向量集合,其中包含的這些向量用來表示一張活潑的臉龐上不同部分是如何移動(dòng)以模擬一個(gè)基本的情感。
當(dāng)然通過計(jì)算機(jī)創(chuàng)建的虛擬表情仍需要我們?nèi)祟愖约合刃性u估,具體來說是找了一些志愿者詢問他們當(dāng)一個(gè)虛擬角色 (Avatar)靠近或走遠(yuǎn)或從一側(cè)觀看時(shí),其面部表情表達(dá)了什么樣的情緒及其強(qiáng)烈程度。實(shí)驗(yàn)結(jié)果顯示這些由計(jì)算機(jī)產(chǎn)生的虛擬表情或多或少傳達(dá)了同真實(shí)人臉?biāo)鶄鬟f的一樣的情感。為什么是或多或少,因?yàn)檫@確實(shí)有一些主觀色彩的問題不那么好解決,比如一張恐懼的面部表情也可能看起來是一張吃驚的面部表情,一張厭惡的面部表情也可能與生氣時(shí)的表情相混淆。
有意思的是 Broekens 也進(jìn)行了這樣的實(shí)驗(yàn),將兩種基本的虛擬表情做個(gè)簡單的線性組合生成新的表情,然后讓志愿者們做評估。例如將高興的表情和生氣的表情做線性組合就可以傳遞出邪惡或頑皮的表情。人們的面部表情其實(shí)是很豐富的,可以猜想作為六種最基本的表情通過將其不同的線行組合就能夠產(chǎn)生許許多多豐富的表情,這肯定是一件很有趣的事情。對這個(gè)實(shí)驗(yàn)感興趣的讀者可以參閱這片論文。
雖然可能六種基本表情未必能最本質(zhì)反應(yīng)人們的情感,但這樣的選擇足以包含日常生活中人們常用的情感表達(dá)。通過對虛擬人物增加了豐富多彩的面部表情信息后,將為我們的人機(jī)交互帶來全新的體驗(yàn)。盡管微軟已經(jīng)將 Kinect 做了很多深度開發(fā)比如增加了視頻會議或社交元素,其中的人物都是計(jì)算機(jī)生成的虛擬人物但如果將這些人物同時(shí)賦予能夠表達(dá)人類情感的面部表情信息,這又將為我們提供更加有趣的交互體驗(yàn)。
現(xiàn)在可以想象,通過計(jì)算機(jī)視覺技術(shù)對你的面部進(jìn)行分析識別出你的大致年齡(國內(nèi)外有相關(guān)學(xué)者正在從事這樣的工作),然后生成年齡匹配的一個(gè)虛擬人物,再對你的面部表情實(shí)時(shí)分析,給你的虛擬人物也同時(shí)附上相似的虛擬表情,這樣在虛擬世界中就產(chǎn)生了一個(gè)近乎真實(shí)且富含感情色彩的你,再通過 Kinect 就能與其他的虛擬人物進(jìn)行情感互動(dòng),甚至是計(jì)算機(jī)本身虛擬的人物。這必將引領(lǐng)人機(jī)交互領(lǐng)域的大發(fā)展,其背后強(qiáng)大的學(xué)習(xí)算法和識別方法以及云計(jì)算技術(shù)將功不可沒,相信未來的人機(jī)交互將更加多姿多彩。
倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...
關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...
關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)