科技巨頭要用無(wú)障礙技術(shù)改變世界!看看都做了什么?
科技改變生活將會(huì)貫穿科技發(fā)展的整個(gè)過(guò)程,不同的技術(shù)會(huì)給生活帶來(lái)不同程度的變化,并且不同的群體在相同的時(shí)間也會(huì)感受到不一樣的變化。如今,不少人正在期待VR和AR技術(shù)帶來(lái)的不一樣的視覺(jué)體驗(yàn)以及AI技術(shù)帶來(lái)的便利生活。但對(duì)于部分特殊人群而言,他們因?yàn)槁?tīng)說(shuō)看的障礙離科技有著遙遠(yuǎn)的距離。
不過(guò),國(guó)內(nèi)外的科技巨頭們都在努力通過(guò)無(wú)障礙科技改變他們的世界。更讓人興奮的是,騰訊和Facebook已經(jīng)用上了AI技術(shù),這將有何不一樣?
科技巨頭們跨越兩個(gè)時(shí)代的無(wú)障礙科技
在手機(jī)成為人們活中不可缺少的一部分之前,PC的普及改變了我們獲取信息、工作和生活的方式。Windows作為全球使用最廣泛的PC操作系統(tǒng),微軟也早已在系統(tǒng)中加入了不少針對(duì)視覺(jué)、顏色識(shí)別、聽(tīng)覺(jué)、讀寫能力等人群的輔助功能,主要是為鍵盤交互和屏幕閱器提供支持,為用戶自定義(如文字、縮放設(shè)置、顏色和高對(duì)比度)提供支持,為UI某些部分提供替換選項(xiàng)或候補(bǔ)選項(xiàng)。
最新的操作系統(tǒng)Windows10中,微軟針對(duì)視覺(jué)障礙人群有屏幕閱讀器、高對(duì)比度主題、放大器等功能;聽(tīng)力障礙的人群可以借助字幕了解試聽(tīng)媒體內(nèi)容;行動(dòng)障礙人群可以通過(guò)語(yǔ)音識(shí)別技術(shù)來(lái)解決使用問(wèn)題。體驗(yàn)方面,從微軟展示的視頻看,語(yǔ)音對(duì)屏幕內(nèi)容的描述速度對(duì)視覺(jué)障礙的用戶可能有些快,對(duì)沒(méi)有視覺(jué)障礙的人來(lái)說(shuō)描述有顯得有些簡(jiǎn)單。
移動(dòng)互聯(lián)網(wǎng)時(shí)代,Android和iOS統(tǒng)治著市場(chǎng),因此谷歌和蘋果也都在自家的系統(tǒng)中加入了輔助功能。Android的無(wú)障礙功能有屏幕閱讀器,通過(guò)觸目和語(yǔ)音反饋實(shí)現(xiàn)與設(shè)備的互動(dòng);還有顯示的更改設(shè)置,包括字體大小、放大功能以及顯示的對(duì)比度和顏色;互動(dòng)控件則是借助語(yǔ)音打開(kāi)應(yīng)用和進(jìn)行導(dǎo)航及修改文字;還可以通過(guò)藍(lán)牙將可刷新的盲文顯示屏連接到Android設(shè)備;也能為Android設(shè)備開(kāi)啟字幕顯示功能及指定的字幕。當(dāng)然,基于原生Android系統(tǒng)的無(wú)障礙功能,手機(jī)廠商和OEM也能再做無(wú)障礙功能的改進(jìn)和創(chuàng)新。
有意思的是,iPhone上的無(wú)障礙功能曾被廣泛使用。由于早期iPhone Home鍵容易發(fā)生失靈的情況,不少iPhone用戶都開(kāi)啟了輔助功能中的AssistiveTouch,這其實(shí)是蘋果為有肢體障礙的人群設(shè)計(jì)的功能,也是蘋果多個(gè)的無(wú)障礙功能之一。據(jù)了解,蘋果在iOS系統(tǒng)中加入針對(duì)殘障人群的功能可以追溯到2009年iPhone 3GS中的顏色反轉(zhuǎn),后來(lái)系統(tǒng)中又增加了專門為視障人士開(kāi)發(fā)的屏幕閱讀技術(shù)VoiceOver、放大鏡等功能。如今的iOS系統(tǒng)針對(duì)視力、聽(tīng)力、肢體與活動(dòng)能力、學(xué)習(xí)與讀寫能力有障礙的人群都加入了輔助功能。
我們知道,蘋果在PC、移動(dòng)領(lǐng)域都取得了不錯(cuò)的成績(jī),所以除了iOS系統(tǒng),蘋果PC使用的macOS系統(tǒng)中也包含屏幕和光標(biāo)放大、全功能屏幕閱讀器、可視閃爍提醒、隱藏式字幕支持等輔助功能。還有值得一提的是,除了軟件方面的設(shè)計(jì),蘋果在iPhone7和Apple Watch中內(nèi)置了Taptic引擎,通過(guò)振動(dòng)向用戶提供觸覺(jué)反饋,這一設(shè)計(jì)結(jié)合Watch OS 3.0能為視覺(jué)障礙用戶報(bào)時(shí)。
社交巨頭融合AI的無(wú)障礙技術(shù)
可以看到,微軟、谷歌、蘋果都在自家系統(tǒng)中增加了輔助功能,為的是人數(shù)占比不大的殘障人士也能享受到科技帶來(lái)的便利,這些系統(tǒng)中的無(wú)障礙技術(shù)有諸多相似之處也各有一些差異,體驗(yàn)也存在差別。
當(dāng)然,僅有系統(tǒng)層面的無(wú)障礙技術(shù)還遠(yuǎn)遠(yuǎn)不夠,不同的應(yīng)用想要實(shí)現(xiàn)更好的體驗(yàn)需要更有針對(duì)性的無(wú)障礙技術(shù)。值得注意的是,發(fā)現(xiàn)美國(guó)科技巨頭Facebook和中國(guó)社交巨頭騰訊都是率先將AI技術(shù)融入到無(wú)障礙科技的公司。
Facebook在打造的是無(wú)障礙環(huán)境的過(guò)程中,除了在應(yīng)用上兼容不同系統(tǒng)的無(wú)障礙功能,F(xiàn)acebook還將反饋融入AI系統(tǒng),讓視覺(jué)障礙的人群也能“讀懂”照片內(nèi)容。Facebook希望借助自家的Automatic Alt-Text (AAT)技術(shù),讓屏幕閱讀器用戶也能夠理解新聞推送中大部分甚至全部的圖像內(nèi)容。
國(guó)內(nèi)的社交巨頭騰訊同樣也在兼容PC和手機(jī)設(shè)備系統(tǒng)的基礎(chǔ)上,用AI技術(shù)幫助視障用戶“看到”圖片,破除他們的社交障礙。據(jù)悉,在QQ空間獨(dú)立版7.7安卓版的新功能中,有一個(gè)是用AI技術(shù)對(duì)圖片進(jìn)行描述并自動(dòng)朗讀。具體來(lái)說(shuō),使用安卓系統(tǒng)的視障用戶可以在QQ空間APP點(diǎn)擊圖片,讀屏軟件會(huì)朗讀出AI生成的一句圖片描述,借助科技可以“看到”網(wǎng)友分享的圖片,更深層參與到社交場(chǎng)景中。
QQ空間無(wú)障礙版本“圖片語(yǔ)音即時(shí)描述功能”
了解到,具備上述功能的QQ空間APP融入了來(lái)自騰訊AI Lab的圖像描述生成技術(shù),這項(xiàng)技術(shù)是騰訊AI Lab自主研發(fā)的強(qiáng)化學(xué)習(xí)算法,在國(guó)際頂級(jí)大賽MS COCO的該類別挑戰(zhàn)賽上排名第一,超越微軟和谷歌等公司。
或許在沒(méi)有視覺(jué)障礙的人群看來(lái)這個(gè)技術(shù)不夠“黑科技”,但從學(xué)術(shù)研究的角度來(lái)看,圖像描述生成的研究不僅僅需要理解圖像,更需要理解自然語(yǔ)言,這是一個(gè)跨學(xué)科跨模態(tài)的交叉研究課題,也是對(duì)深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力向多個(gè)數(shù)據(jù)域擴(kuò)展的一步重要的探索。
騰訊 AI Lab 研發(fā)了新的強(qiáng)化學(xué)習(xí)算法(Reinforcement Learning)以進(jìn)一步提高圖像描述生成的模型能力(原理如圖),相應(yīng)的圖像描述生成模型,采用了編碼器-解碼器(encoder-decoder)的框架,同時(shí)引入了注意力(attention)的機(jī)制。在解碼的過(guò)程中,AI Lab 創(chuàng)新性地使用了多階段的注意力機(jī)制,除了引入多階段的注意力機(jī)制,AI Lab 所研發(fā)的強(qiáng)化學(xué)習(xí)算法能進(jìn)一步提升構(gòu)建的網(wǎng)絡(luò)模型的訓(xùn)練效果,另外,針對(duì)此不可微的問(wèn)題,AI Lab 使用強(qiáng)化學(xué)習(xí)算法訓(xùn)練網(wǎng)絡(luò)模型以優(yōu)化這些衡量指標(biāo)。
圖像描述生成(image captioning)
除了圖片描述,QQ還和優(yōu)圖團(tuán)隊(duì)合作推出了OCR圖片文字提取功能。具體來(lái)說(shuō),只要打開(kāi)手機(jī)QQ,長(zhǎng)按對(duì)話框中的圖片選擇“提取圖中文字”,或是點(diǎn)擊“掃一掃”中的“文字提取”,就可以將圖片上的文字內(nèi)容智能識(shí)別成為可編輯的文本,讓視障用戶可以很方便地提取好友發(fā)的圖片上的文字。同時(shí),OCR圖片文字提取功能可以實(shí)現(xiàn)多場(chǎng)景應(yīng)用落地,幫助視覺(jué)障礙用戶閱讀書籍、食品、藥品說(shuō)明書等。
OCR圖片文字提取功能的背后是優(yōu)圖實(shí)驗(yàn)室世界領(lǐng)先的深度學(xué)習(xí)技術(shù),它可以在任意版面下識(shí)別出整圖的文字,包括中英文、字母、數(shù)字、標(biāo)點(diǎn)等共1000種標(biāo)簽,并覆蓋到數(shù)十種字體,滿足生活中大部分場(chǎng)景的讀圖識(shí)字需求。
手機(jī)QQ OCR識(shí)別功能
在AI技術(shù)的加持下,視障用戶的社交痛點(diǎn)正在被解決。一位體驗(yàn)了QQ空間自動(dòng)識(shí)別圖片后“說(shuō)出”文字描述的視障用戶說(shuō):“醫(yī)學(xué)不能讓我們復(fù)明,但或許科技可以。”另外,一位湖南視障用戶因?yàn)樽x屏軟件讀取QQ表情為空信息而困擾,為此手機(jī)QQ開(kāi)發(fā)出表情讀取功能讓他不僅能與外界順暢溝通也能用表情表達(dá)內(nèi)心的想法。認(rèn)為,隨著AI技術(shù)的加持,未來(lái)QQ將能夠更生動(dòng)地讀取更多的表情包,讓視障人群能夠更好地使用表情包。
QQ表情讀取
用無(wú)障礙技術(shù)改變世界
騰訊用AI技術(shù)讓更多的視障用戶能夠更容易地進(jìn)行社交,其實(shí)早在2009年騰訊就開(kāi)始關(guān)注視障用戶使用情況,在PC中推動(dòng)無(wú)障礙技術(shù)的改造,使QQ成為國(guó)內(nèi)盲人群體最主要的網(wǎng)絡(luò)社交平臺(tái)。2013年,手機(jī)QQ作為國(guó)內(nèi)首批支持無(wú)障礙特性的APP。2014年1月,騰訊公益慈善基金與致力推動(dòng)信息無(wú)障礙的NGO一起組建了“視障信息無(wú)障礙工程師”團(tuán)隊(duì)。
2017年,手機(jī)QQ共適配1934個(gè)無(wú)障礙特性,技術(shù)上推出OCR圖片文字提取功能、QQ表情讀取、安卓平臺(tái)安全支付、聲紋加好友、有效識(shí)別多條鏈接等無(wú)障礙功能。2018年3月,在中國(guó)殘疾人聯(lián)合會(huì)、中國(guó)盲人協(xié)會(huì)、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)信息無(wú)障礙工作委員會(huì)的支持下,QQ空間啟動(dòng)“無(wú)障礙AI技術(shù)”對(duì)外開(kāi)放項(xiàng)目,通過(guò)“多媒體AI平臺(tái)”小程序上的“無(wú)障礙AI”入口,首批開(kāi)放包括OCR文字識(shí)別、語(yǔ)音合成、圖片轉(zhuǎn)語(yǔ)音三大無(wú)障礙AI 技術(shù)。
目前,騰訊旗下的QQ、QQ空間、微信、騰訊網(wǎng)、騰訊新聞、應(yīng)用寶、企鵝FM等大部分產(chǎn)品已針對(duì)殘障用戶實(shí)現(xiàn)專門優(yōu)化。值得一提的是,QQ和QQ空間相關(guān)功能在2018年使用量超過(guò)1.6億次,已經(jīng)成為國(guó)內(nèi)視障群體最主要的網(wǎng)絡(luò)社交平臺(tái)。
騰訊在這一領(lǐng)域的持續(xù)付出也得到了認(rèn)可,法國(guó)當(dāng)?shù)貢r(shí)間2018年12月3日,聯(lián)合國(guó)教科文組織(UNESCO)在巴黎頒發(fā)“數(shù)字技術(shù)增強(qiáng)殘疾人權(quán)能獎(jiǎng)”,該獎(jiǎng)項(xiàng)表彰“促進(jìn)殘疾人包容發(fā)展,通過(guò)數(shù)字技術(shù)為殘疾人生活創(chuàng)造合理便利條件做出杰出貢獻(xiàn)”的個(gè)人和組織。需要指出的是,騰訊是亞洲首個(gè)獲獎(jiǎng)的組織,也是全球范圍內(nèi)首家獲獎(jiǎng)的企業(yè)。
小結(jié)
殘障人群數(shù)量只占全球人口總數(shù)的很小比例,但是我們欣慰的看到無(wú)論是主宰PC時(shí)代的Windows系統(tǒng)還是統(tǒng)治手機(jī)時(shí)代的Android和iOS都為殘障人群增加了輔助功能,社交巨頭騰訊和Facebook更是率先將AI技術(shù)應(yīng)用到自家的產(chǎn)品中,提升殘障人士的使用體驗(yàn),破除他們的社交障礙,讓所有人都能感受到科技改變生活,更是科技巨頭們用技術(shù)改變世界的一個(gè)舉動(dòng)。
現(xiàn)在,我們不僅看到有越來(lái)越多公司的產(chǎn)品開(kāi)始加入針對(duì)殘障人群的設(shè)計(jì),也看到了騰訊早在2009年就開(kāi)始關(guān)注視障用戶,希望用極致的產(chǎn)品體驗(yàn)滿足所有人的社交需求,并且這個(gè)努力也得到了聯(lián)合國(guó)教科文組織的認(rèn)可。