公元2008,奧運(yùn)之年。今年“5·17”世界電信日的主題已確定,“讓信息通信技術(shù)惠及殘疾人”。今年工信部把行風(fēng)建設(shè)的主題確定為“通信服務(wù)與社會責(zé)任”。
主辦奧運(yùn)會的北京市把市政和建筑物的無障礙建設(shè)推到了一個新的水平。
為了支持同年將舉辦殘奧會,歌星劉德華自費(fèi)、自詞、自唱了奧運(yùn)歌曲《Everyone Is NO.1》,中國移動提供無線音樂平臺供人們無線下載,下載熱浪空前。
所有這一切都無不警世人們:關(guān)注殘疾人事業(yè)。在這個不平凡的年代,我們不禁要問自己:作為IT業(yè)者,我們?yōu)闅堈先耸聵I(yè)做了什么?做得怎么樣?將來我們究竟可以做到哪一步?
殘障人信息無障礙 --- 本世紀(jì)的偉大理想
殘障人的殘障分為肢體障礙、智力障礙和感官障礙。肢體障礙使人的行動不便,而行動的無障礙設(shè)計包括從坡道、廁所、拐杖、輪椅,一直到最高級的可以與人的神經(jīng)系統(tǒng)相連的智能假肢等等一系列硬件產(chǎn)品和設(shè)施。對智障的關(guān)愛,需要健康人和殘障人之間進(jìn)行大量的接觸和交流。
感官障礙主要指聽說障礙和視覺障礙。
我們知道人獲取信息一個靠聽,一個靠看,所以聰和明是人豐富知識、發(fā)展智力和與社會互動的必要條件。
隨著電腦、電信和互聯(lián)網(wǎng)的飛速發(fā)展,由于經(jīng)濟(jì)條件和受教育條件的不同,社會的差距也在迅速擴(kuò)大。誰占有豐富的信息,誰的生活和工作效率就會更高,創(chuàng)造財富的能力就越強(qiáng),這種現(xiàn)象無論在個人,還是在企業(yè),甚至在國家身上都存在,就是說信息已經(jīng)成為產(chǎn)生社會差距和不和諧現(xiàn)象的加速力。
社會信息化對于健康人造成的壓力況且如此,那么對于有感官障礙的人群受到的壓力更可想而知了,這種壓力比以往任何時代都大,甚至有一點點殘酷。往往感官障礙者的智商一般還比較高,他們對信息的渴望往往比健康人還強(qiáng)烈。感觸到信息洪流的脈動卻無法獲得,這種孤獨(dú)和被邊緣化的感覺甚于以前的時代,言其殘酷絲毫不過分。
上面我們分析了,智障主要靠家庭成員和社會工作者與之進(jìn)行耐心接觸來激發(fā)其智商、情商的潛質(zhì);肢體障礙主要靠高質(zhì)量的硬件產(chǎn)品來輔助實現(xiàn)無障礙。肢體殘障的無障礙產(chǎn)品的歷史比較悠久,發(fā)展亦成熟,唯有感官殘障的無障礙技術(shù)發(fā)展最慢,基本停留在啞語和盲文的水平上,因此人的感官障礙已經(jīng)成為殘酷的信息障礙。信息快速發(fā)展和信息障礙的存在形成了巨大的反差,嚴(yán)重影響了殘障人享有信息的權(quán)益。
北京捷通華聲語音技術(shù)公司致力于人機(jī)交互(HCI)技術(shù)的研發(fā),一直積極支持殘障人事業(yè),譬如用手寫識別技術(shù)支持聾啞人的信息交流,用語音識別和語音合成幫助盲人使用電腦.捷通華聲在2000年、2003年幾次榮獲北京市和廣州市殘聯(lián)的支持殘障人事業(yè)獎項,直到2007年2月,捷通華聲的“盲人手機(jī)導(dǎo)航”項目榮獲了美國高通公司BREW“無線關(guān)愛”應(yīng)用基金的支持,捷通華聲支持殘障人事業(yè)開始了新的篇章。
捷通華聲公司《盲人手機(jī)導(dǎo)航》項目憑借其嵌入式語音技術(shù),創(chuàng)新并充分體現(xiàn)人文關(guān)懷的產(chǎn)品設(shè)計,在激烈的競爭評選中脫穎而出,數(shù)以百計的參選方案中全球僅有5家科技企業(yè)獲此殊榮。
捷通華聲《盲人手機(jī)導(dǎo)航》全面應(yīng)用捷通華聲具有自主知識產(chǎn)權(quán)的嵌入式語音合成與語音識別技術(shù),在產(chǎn)品設(shè)計中打破手機(jī)傳統(tǒng)的使用方式,使其具備能“說”會“聽”的智能交互功能,從而使得視覺障礙者希望利用移動通訊設(shè)備實現(xiàn)獲取更多信息的夢想成為可能?!睹と耸謾C(jī)導(dǎo)航》通過語音識別技術(shù),讓手機(jī)“聽懂”人的聲音指令,應(yīng)用語音合成技術(shù)將文本信息“朗讀”出來,幫助視覺障礙者將平時人們習(xí)慣的“看”短信、“看”來電號碼、“看”時間等轉(zhuǎn)變?yōu)?ldquo;聽”短信、“聽”來電號碼、“聽”時間等功能,手機(jī)中天氣預(yù)報、語音詞典、信息查詢、日程安排等功能也都可以通過聲音交互而完成,從而使視覺障礙者也分享到移動通訊帶給人類的便利,共同享受工作與生活的樂趣。
捷通華聲《盲人手機(jī)導(dǎo)航》是實現(xiàn)“信息無障礙”的一次成功嘗試,捷通華聲還將為此繼續(xù)努力。
CTI 服務(wù)殘障人 --- “C”的任務(wù)大于“T”
在上個世紀(jì)90年代初期,CTI還只是通信科學(xué)領(lǐng)域的一個技術(shù)名詞,具體地講,在計算機(jī)主板的PCI插槽插上語音卡同電話網(wǎng)相連,以語音卡識別電信的音頻碼,接受客戶的服務(wù)要求,回答客戶時把文本的內(nèi)容通過TTS處理合成出來人的聲音用電話播講,這就是CTI基本應(yīng)用,即所謂計算機(jī)與通信的融合。
CTI在中國的特快發(fā)展始于本世紀(jì)初,它與中國現(xiàn)代服務(wù)業(yè)、電信業(yè)和IT業(yè)的快速相伴隨,從7x24小時電話銀行到彩信、彩玲,CTI已經(jīng)深深影響了人們的生活。隨著數(shù)字化高清晰電視和3G的實現(xiàn),CTI必將有激動人心的發(fā)展。
面對如此豐富多彩的盛宴,我們同樣想到一個問題,我們能夠安心享用CTI而忘記殘障弟兄姐妹嗎?
捷通華聲的HCI技術(shù)發(fā)展于支持殘障人事業(yè)的終極目標(biāo)是徹底實現(xiàn)聾啞人和盲人的信息交流無障礙,譬如健康人可以通過ASR語音識別跟聾啞人說話,聾啞人用讀手機(jī)屏幕和手寫實現(xiàn)聽和說;盲人可以用口述方式實現(xiàn)信息檢索,用耳朵聽取信息檢索的結(jié)果。
坦率地說,真正意義上的信息無障還是比較困難的。
因為計算機(jī)發(fā)展今天,雖然它的速度已經(jīng)很快,但是其智商并不高。如今世界上最先進(jìn)的計算機(jī),可以戰(zhàn)勝國際象棋大師的計算機(jī),其智商也只相當(dāng)于一只蜥蜴,我們平時使用的計算機(jī)的智商只在昆蟲的水平。計算機(jī)是基于0和1這兩個最簡單數(shù)字來實現(xiàn)高速度精確計算的,而人類一開始學(xué)習(xí)知識就具有排除具體差異干擾,建立概念,具備容錯和模糊的能力。
我們假設(shè)大家可以像播音員一樣標(biāo)準(zhǔn)地講話,即便如此,這里依然存在著幾種模糊,如:語音模糊,音詞轉(zhuǎn)換模糊,指代性模糊,多義模糊和語義切分模糊等等,況且我們平時講話不可能沒有說錯的時候,諸如咬字不清、用錯詞匯、習(xí)慣性的口頭語、重復(fù)、省略、補(bǔ)充、糾正插入、發(fā)音錯誤、不規(guī)范的語法等等,人類在會話中可以“諒解”這些錯誤,一般不影響理解。可是綜合所有這些因素將使計算機(jī)語音識別的計算變得一塌糊涂。[!--empirenews.page--]
盡管困難,但是對于人機(jī)交互(HCI),尤其是基于漢語的HCI,中國的科學(xué)家一直沒有停止努力。中科院聲學(xué)所黃曾陽研究員提出了基于自然語言理解的"概念層次網(wǎng)絡(luò)理論",即HNC理論(HNC即Hierarchical Network of Concepts 的縮寫)。這個理論一出現(xiàn),立刻在我國計算語言界引起了廣泛的重視和認(rèn)同,一些著名學(xué)者稱隨著這一理論在計算機(jī)上逐步實踐,計算機(jī)自然語言理解上將獲得突破?,F(xiàn)在HNC在我國已經(jīng)成為一門獨(dú)立的學(xué)科,很多大學(xué)和科研機(jī)構(gòu)專門研究它。中國科學(xué)家把HNC認(rèn)定為本世紀(jì)一定要攻克的任務(wù)。
根據(jù)這個理論,我國科學(xué)家在計算機(jī)上設(shè)計了一套計算機(jī)可讀的符號系統(tǒng),建立了富有漢語特色的知識庫,知識庫中包含了內(nèi)容極其豐富、內(nèi)在邏輯關(guān)系十分嚴(yán)密的網(wǎng)絡(luò)結(jié)構(gòu)語義信息。
有了HNC,當(dāng)電腦“聽”到第一二句話的時候,系統(tǒng)會馬上建立可能的語境,揭示會話的隱藏知識,在處理語言細(xì)節(jié)方面還有單字詞感知、語義塊感知、句類判定等處理模塊。有了HNC這幾個模塊的處理,語音識別就可以識破語言中丟詞、錯詞、語序錯、語法錯等造成的陷阱,在語音信號方面,系統(tǒng)依據(jù)知識庫來彌補(bǔ)語音信號的缺失和變形,計算的效率和準(zhǔn)確性將大大提高。
所以我們說說HNC的成功之日才是真正的信息無障之時。
無障礙 —— 不僅僅為了殘障人
毋庸置疑因為殘障人畢竟屬于少數(shù)人群,殘障人的支付能力,產(chǎn)品研發(fā)的投入與產(chǎn)出都將困擾“信息無障礙”事業(yè)的發(fā)展。
不過我們發(fā)現(xiàn)了幾點理由證明“信息無障礙”事業(yè)不僅僅是為了殘障人,也是為了我們自己。
這個理由還不包括因為“天有不測”,健康人在不測之日變成殘障人之類的命運(yùn)話題。
理由一:“信息無障礙”可以助力我們迎接老齡化社會
人是要老的,現(xiàn)代社會已經(jīng)加快了老齡化步伐。就像人終究需要一根拐杖或者輪椅一樣,多數(shù)人老了之后將被視力障礙和聽力障礙所困擾。那么如果有了語音識別和語音合成的助力,老人與社會的溝通就會變得方便,老人就少了孤獨(dú)的感覺。
社會老齡化加劇,社會服務(wù)老人的總成本無疑會增加,怎樣實現(xiàn)既要保證老人們生活水平不下降,得到社會關(guān)愛,又有效控制總成本呢?服務(wù)老年人群的、智能的IVR中心將扮演越來越重要的角色。以老人為服務(wù)對象的IVR中心,將能夠和老人聊天,響應(yīng)他們的服務(wù)需求,解決他們的問題。
今天我們?yōu)橹悄艿腎VR技術(shù)而奮斗,說不定將來我們就是這個IVR的受益人。
理由二:“信息無障礙”可以助力我們實現(xiàn)人的平等和社會和諧
現(xiàn)代社會似乎有這樣一種潛規(guī)則:
你要獲得更高的社會地位嗎?讀書吧,你獲得的知識越多,學(xué)位越高,你的社會地位將更高;
你想獲得更多的信息嗎?讀書吧,你具備的知識越多,更多的信息對于你才有用,不然信息之海對于你不過是過眼的煙云,不知其所云;
你想獲得最終的學(xué)歷嗎?讀書吧,不管有用沒有用你必須沿著這個臺階走下去。
有的時候,你只想弄清一個簡單問題,為此你也許要讀上一大本書,為了找到那一頁,也許你要讀上200頁。
因此我們的社會對于愛讀書大加歌頌,勤奮和精力充沛的人成了佼佼者,盡管這絕對正確,無可厚非,但是社會也因此失去和諧,差距因此擴(kuò)大。
美國加利福尼亞大學(xué)的威廉-克勞斯曼教授發(fā)現(xiàn)了這個問題,他大膽預(yù)言2050年世界將從“印刷文化”向“口語文化”回歸!人類最早的知識就是口口相傳的,可是后來知識越來越多,不得不借助于文字。隨著文字越發(fā)地高深浩瀚,被社會邊緣化的人群越多。所以這種回歸非常必要,因為大多數(shù)人在大多數(shù)情況下需要的是結(jié)論而不是推理。
這種回歸就是我們?yōu)橹畩^斗的“信息無障礙”,它的最直接的技術(shù)就是語音識別與語音合成,當(dāng)然它的下邊還有知識的分類和互聯(lián)網(wǎng)作支撐。
科學(xué)技術(shù)將第一次直接助力和諧社會的建立。
社會將有那么一天,無論是健康人還殘障人,以什么方式都可以獲得知識和信息;無論是青壯年人還是老人或孩子,它們都可以享受社會同樣的服務(wù),而遠(yuǎn)離孤獨(dú);也無論學(xué)歷高低,甚至文盲,在獲取需要的知識上將沒有不同。平等和和諧由此而生。
“信息無障礙”,為此奮斗不會錯。