谷歌使用AI幫助視障人士“看見(jiàn)圖片”
Google Chrome上的TalkBalk是一項(xiàng)眾所周知的輔助功能,可幫助視障人士瀏覽網(wǎng)絡(luò)。但是,對(duì)于圖像而言,它的用處遠(yuǎn)不大,因?yàn)樗鼉H限于閱讀圖像描述,甚至經(jīng)常被省略?,F(xiàn)在,Google推出了一項(xiàng)新功能來(lái)提供幫助。
谷歌的輔助功能高級(jí)項(xiàng)目經(jīng)理 Laura Allen 自己也有視力問(wèn)題。她說(shuō),當(dāng)嘗試使用屏幕閱讀器查看網(wǎng)站時(shí),該功能將減輕許多麻煩。
“目前的不幸狀況是,網(wǎng)絡(luò)上仍然有數(shù)百萬(wàn)無(wú)標(biāo)簽的圖像。當(dāng)你使用屏幕閱讀器或盲文顯示器進(jìn)行輔助時(shí),實(shí)際上只會(huì)聽(tīng)到‘圖片’或‘未標(biāo)記的圖片’,或者是完全不相關(guān)的超長(zhǎng)數(shù)字串,即文件名。”
而 Chrome 的這項(xiàng)新功能會(huì)直接描述圖片的具體內(nèi)容,例如,它可能會(huì)告訴你:“這似乎是一輛小型摩托車(chē)。”該提示由 AI 生成,因此不一定精確,所以會(huì)在描述內(nèi)容前加上“似乎是”這樣的話語(yǔ)。
該功能僅適用于帶有屏幕閱讀器或盲文顯示器的用戶。用戶只需轉(zhuǎn)到 Chrome 設(shè)置>高級(jí)>輔助功能,然后選擇“從 Google 獲取圖像描述”來(lái)啟用它。也可以通過(guò)右鍵單擊并拉出上下文菜單來(lái)啟用單個(gè)網(wǎng)頁(yè)的設(shè)置,在該菜單中可以找到相同的選項(xiàng)。
Chrome正式啟動(dòng)的自動(dòng)圖像描述,它使用機(jī)器學(xué)習(xí)算法來(lái)猜測(cè)圖像的內(nèi)容并生成文本描述。如果啟用,此功能會(huì)將圖片發(fā)送到Google服務(wù)器進(jìn)行處理,然后閱讀有關(guān)圖片內(nèi)容的說(shuō)明(這些圖片未存儲(chǔ)在Google服務(wù)器上)。
該工具對(duì)于博客和社交媒體等獨(dú)立來(lái)源的數(shù)百萬(wàn)張照片應(yīng)該“超級(jí)有幫助”。最終,看到機(jī)器學(xué)習(xí)使每個(gè)人都可以更輕松地訪問(wèn)互聯(lián)網(wǎng)真是令人興奮。