眾所周知,借助人工智能技術(shù)的進(jìn)步,越來越多的科技巨頭和初創(chuàng)公司加入到幫助視障人士安全、獨立出行的行列中,希望能讓每位艱難獨行的盲人以和你我不同的方式感知這個世界。
IBM日本公司正和4家合作伙伴開發(fā)看起來像行李箱的小型導(dǎo)航機器人;荷蘭初創(chuàng)公司Envision與谷歌眼鏡合作開發(fā)的AI眼鏡已開始接受預(yù)訂,預(yù)計今年8月就可向客戶發(fā)貨。
2019年10月8日,世界衛(wèi)生組織發(fā)布的第一份《世界視力報告》顯示,全球至少有22億人正面臨視力受損或完全失明。
在用其他感官輔助視覺缺憾的技術(shù)思路中,語音+圖像識別技術(shù)正激發(fā)著越來越多的創(chuàng)新。而硬件技術(shù)和邊緣計算的跟進(jìn),則大大提升了視覺AI技術(shù)的實用價值,無論是國外還是國內(nèi)的各類科技公司,前赴后繼的改良讓使用者在即時感知及反饋上越來越趨近于理想設(shè)計。
通過掃描視障人士的位置和地圖數(shù)據(jù),IBM的“行李箱”找到最佳路線后,可以利用語音和觸覺技術(shù)將視障人士引導(dǎo)至目的地。視障人士行走過程中,“行李箱”通過視頻和其他傳感器獲得的周圍人的行為、障礙物等信息,給出行動指令。還有個互動對話功能很溫暖,如果有朋友恰巧在附近,視障人士可以say hello。
但是,行李箱的商業(yè)化至少還要3年,有不少挑戰(zhàn)尚待突破。
Envision的AI眼鏡,則讓視覺障礙人士以“聽”的方式“看”到周圍的環(huán)境,引導(dǎo)他們識別路面障礙物、交通標(biāo)識等。佩戴者不僅可以獨立完成日常出行,還可以“閱讀”食譜,到超市或雜貨店找到對應(yīng)食材、調(diào)料后回家烹飪。當(dāng)然,也可以通過“面部識別”功能叫出朋友的名字。
Envision的AI眼鏡中運用的OCR(光學(xué)字符識別)概念,自1929年德國科學(xué)家提出以來,一直是模式識別領(lǐng)域重要的研究方向。隨著基于深度學(xué)習(xí)的圖像識別達(dá)到前所未有的高度,OCR技術(shù)有了廣闊的場景,如今,幾乎所有的互聯(lián)網(wǎng)公司都在用OCR技術(shù)解決相關(guān)問題。但這樣一款眼鏡價格不菲,至少需要1699美元。
當(dāng)AI成為智障人士的“眼睛”,層出不窮的“助視”產(chǎn)品是否能真正滿足使用者的需求?或許視障人士本人才是最好的創(chuàng)新者,他們知道自己愿意做什么樣的嘗試和改變。IBM日本的研究員淺川智恵子,也是位視障人士,她的一次商務(wù)旅行讓IBM的人工智能“行李箱”項目提上日程。
薩基博·薩科是微軟必應(yīng)(Bing)的一位軟件工程師,7歲不幸失明,他參與開發(fā)的視覺輔助工具Seeing AI,通過手機攝像頭或一副配備攝像頭的智能眼鏡,結(jié)合圖像識別、語音說明,就可幫助視力障礙群體辨別周圍的環(huán)境、顏色、紙幣或包括文件在內(nèi)的物體。
這樣的案例不僅出現(xiàn)在國外,隨著我國創(chuàng)業(yè)環(huán)境的改善和社會扶持力度的增加,越來越多的視障人士活躍于創(chuàng)新一線,他們對科技產(chǎn)品的理解比很多開發(fā)者還要深入。如盲人企業(yè)家、朝陽區(qū)殘聯(lián)盲人協(xié)會主席曹軍所言:“盲人才能真正理解盲人的痛點?!?
這讓我們看到,雖然在科學(xué)家們的不斷努力下,高成本黑科技產(chǎn)品仍非一般視障人士可負(fù)擔(dān)得起。不管智能產(chǎn)品多炫目,普惠更多的人才更有價值。