www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀] 從自動(dòng)駕駛、無(wú)人機(jī),到監(jiān)控安防,視覺(jué) AI 技術(shù)的突破為人們生活帶來(lái)了巨大改變,在許多領(lǐng)域迎來(lái)爆發(fā)式發(fā)展,僅在國(guó)內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺(jué) AI 獨(dú)角獸。但若真要論能為使用者帶來(lái)多

自動(dòng)駕駛無(wú)人機(jī),到監(jiān)控安防,視覺(jué) AI 技術(shù)的突破為人們生活帶來(lái)了巨大改變,在許多領(lǐng)域迎來(lái)爆發(fā)式發(fā)展,僅在國(guó)內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺(jué) AI 獨(dú)角獸。但若真要論能為使用者帶來(lái)多大改變,恐怕很少有比得上這一項(xiàng),那就是用視覺(jué) AI 來(lái)打造盲人的眼睛。

無(wú)障礙人工智能成顯學(xué),各大科技巨頭亦相繼致力投入

AI for Accessibility、無(wú)障礙人工智能近來(lái)已在國(guó)際間成為一項(xiàng)顯學(xué)。如何將發(fā)展迅速的人工智能技術(shù),用來(lái)改善全世界約 10 億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。

以視障者來(lái)說(shuō),近日 Instagram 就新增一項(xiàng)輔助功能,用 AI 自動(dòng)辨識(shí)照片內(nèi)容并以語(yǔ)音告知用戶。臉書 Messenger 也有無(wú)障礙機(jī)器人(Accessibility Bot),協(xié)助盲人辨識(shí)臉書朋友,甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個(gè)應(yīng)用程序 Facing Emotions,可以將七種最普遍的情緒轉(zhuǎn)化為相應(yīng)的聲音,可以大幅提升盲人與其他人的實(shí)時(shí)互動(dòng)交流。

影像視覺(jué) AI 并不是新的概念,其背后技術(shù)主要包含機(jī)器學(xué)習(xí)深度學(xué)習(xí),再加上 3D 臉部辨識(shí)等。尤其是深度學(xué)習(xí)算法運(yùn)用在訓(xùn)練 AI 來(lái)協(xié)助盲人辨識(shí)物體,可以發(fā)揮非常大的用處。

比方說(shuō),如果我們想要設(shè)計(jì)一個(gè) AI 協(xié)助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔,通過(guò)各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給 AI 看,讓它學(xué)習(xí)什么是一張 10 元紙鈔。通過(guò)大量反覆學(xué)習(xí)后,視障者只要能讓手機(jī)鏡頭看到 10 元紙鈔的一小角,AI 就能將它分辨出來(lái)。

“這些小事,會(huì)讓你很確實(shí)地感覺(jué)到自己的獨(dú)立性。希望隨著人工智能的進(jìn)展,可以讓我們更容易感受環(huán)境,協(xié)助我們完成更多日常事務(wù)”,微軟視覺(jué)輔助應(yīng)用程序 Seeing AI 的項(xiàng)目主管、同時(shí)自身也是視障者的 Saqib Shaikh,近日接受專訪時(shí)這樣對(duì)小編說(shuō)。

圖|微軟技術(shù)負(fù)責(zé)人( Tech Lead)Saqib Shaikh

Saqib Shaikh 在 7 歲時(shí)失去視力,此前不久,他才剛剛得到人生中的第一臺(tái)電腦。

所幸這并不是他與計(jì)算機(jī)科學(xué)之間的句點(diǎn)

而后他就讀視障學(xué)生小學(xué),一位老師看出了他的潛力,鼓勵(lì)他開(kāi)始學(xué)習(xí)打字。此后他一路進(jìn)入大學(xué),主修計(jì)算機(jī)科學(xué),以班上頂尖的成績(jī)畢業(yè),并取得人工智能碩士學(xué)位。而后,他又加入微軟的人工智能團(tuán)隊(duì),并在大約 3 年前通過(guò)微軟內(nèi)部的黑客松競(jìng)賽,以 Seeing AI 這個(gè)項(xiàng)目脫穎而出,獲得資源將之打造為實(shí)際產(chǎn)品,現(xiàn)在已可在美國(guó)地區(qū)免費(fèi)下載。

Seeing AI 用視覺(jué) AI 幫助視障者“聽(tīng)懂”世界

Seeing AI 這個(gè)是一款結(jié)合圖像辨識(shí)、語(yǔ)音說(shuō)明及人性化使用介面的應(yīng)用程序,可以用手機(jī)上的攝像頭識(shí)別所有圖像,包含通過(guò)掃描條形碼來(lái)識(shí)別產(chǎn)品、辨識(shí)身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內(nèi)容,并閱讀出菜單和文件。

同時(shí),這款應(yīng)用程序也可以結(jié)合智能眼鏡,更好地協(xié)助用戶了解所處的周遭環(huán)境。

圖|Seeing AI 是一款結(jié)合圖像辨識(shí)、語(yǔ)音說(shuō)明及人性化使用介面的應(yīng)用程序

Saqib Shaikh 指出,近年深度學(xué)習(xí)技術(shù)的成熟,是 Seeing AI 可以真正發(fā)揮用處的主要關(guān)鍵。通過(guò)深度學(xué)習(xí)訓(xùn)練,向系統(tǒng)展示大量照片,并教導(dǎo)它們照片中的內(nèi)容,AI 可以真正有效辨識(shí)出現(xiàn)實(shí)生活環(huán)境中的各種物體與人物。

但是,要落實(shí)到讓 AI 有效協(xié)助視障者在生活中能真正用上,還必須歸功于近年硬件技術(shù)的發(fā)展,在軟、硬件配合之下,讓視覺(jué) AI 技術(shù)實(shí)用價(jià)值大大提升。尤其是邊緣運(yùn)算風(fēng)潮興起,視覺(jué)信息可以在裝置終端就能完成運(yùn)算,才能對(duì)使用者提供實(shí)時(shí)反饋,讓盲人能夠即時(shí)對(duì)互動(dòng)對(duì)象做出適合的反應(yīng)。

實(shí)時(shí)反饋絕對(duì)是關(guān)鍵。Saqib Shaikh 說(shuō),想像一個(gè)情境,當(dāng)你在一個(gè)會(huì)議上進(jìn)行簡(jiǎn)報(bào)。因?yàn)檫@是一個(gè)正式場(chǎng)合,因此所有人,包含旁邊的同事、上級(jí)主管,都只是安靜聽(tīng)你說(shuō)話,不會(huì)任意發(fā)出聲音。所以在你說(shuō)話的同時(shí),若無(wú)法用眼睛去觀察聽(tīng)眾,你對(duì)于他們的反應(yīng)是毫無(wú)頭緒的,你甚至不知道應(yīng)不應(yīng)該繼續(xù)說(shuō)下去,還是暫停下來(lái)詢問(wèn)聽(tīng)眾的想法。

這時(shí)候,如果有一個(gè) AI 可以幫你辨識(shí)聽(tīng)眾的反應(yīng),實(shí)時(shí)反饋你他們是不是看起來(lái)滿意、尤其是還能辨認(rèn)出特定人士,比方說(shuō)直屬主管的表情和動(dòng)作如何,這樣一個(gè)人工智能,將能夠大大地讓盲人突破限制,改善他們?cè)谌粘9ぷ髦斜憩F(xiàn)。

非監(jiān)督學(xué)習(xí)是視覺(jué)AI 下一步突破關(guān)鍵

今日我們所談的視覺(jué) AI,其實(shí)多半仍局限于靜態(tài)圖像、單一圖像,但 Saqib Shaikh 想像中的 Seeing AI 2.0,將可以解讀一系列的圖像、可以掌握使用者的偏好

“就像當(dāng)我與妻子一起在街上走路時(shí),她會(huì)告訴我有什么我沒(méi)看過(guò)的新東西、有什么有趣的事物。比方說(shuō),她會(huì)告訴我我們很喜歡的一間咖啡店關(guān)門了。”Saqib Shaikh 說(shuō),“一個(gè)真正的人可以了解什么是你會(huì)感興趣、什么是你會(huì)覺(jué)得重要的事物?!?/p>

而 AI 若要能夠做到這一點(diǎn),就不能只是一次辨識(shí)單一圖像,而是還要能綜合理解背后的情境,甚至是接續(xù)出現(xiàn)的新的信息。Saqib Shaikh 分析,這意味著后續(xù) Seeing AI 必須運(yùn)用更多非監(jiān)督學(xué)習(xí)的技術(shù)來(lái)訓(xùn)練 AI,進(jìn)一步拓展 AI 對(duì)多變場(chǎng)景復(fù)雜信息的處理能力。

其實(shí),Saqib Shaikh 早在求學(xué)期間意識(shí)到,為了讓身為盲人的自己表現(xiàn)更好,他必須做很多額外的努力來(lái)改變他所處的生活環(huán)境,包括不只是自己看書、而是要雇請(qǐng)其他人為他朗讀教科書的內(nèi)容等,才能讓自己與其他正常人站在更接近一點(diǎn)的比較基準(zhǔn)上。

當(dāng)時(shí)就有個(gè)朋友建議過(guò)他,與其只用嘴巴說(shuō)要改變生活環(huán)境,不如實(shí)際做點(diǎn)什么真正的改變。這讓他早就思考過(guò),從某種角度來(lái)講,殘疾者本人其實(shí)就是最好的創(chuàng)新者。因?yàn)椋麄儽热魏稳硕剂私鈿埣舱咦钇惹械男枨笫鞘裁??愿意做什么嘗試?可以如何改變?

然而,在 Saqib Shaikh 進(jìn)入微軟工作的近乎前 10 年,他并未在工作上試圖突出任何作為一個(gè)盲人的特殊能力。相反的,他讓自己就像一名正常的工程師一樣,絕大多數(shù)時(shí)間都投入內(nèi)部的主流專案,如 Cortana 等。

“我想,起初我是想證明自己可以成為一個(gè)主流的工程師”,Saqib Shaikh 說(shuō),而轉(zhuǎn)捩點(diǎn)是出現(xiàn)在他于微軟工作的第10年。“工作滿 10 年后,我覺(jué)得我已經(jīng)達(dá)到了目標(biāo),證明了自己的能力,所以我可以開(kāi)始運(yùn)用自己的專業(yè)去幫助其他人。“

現(xiàn)在,他終于決定投入自己真正想做的事情,也就是用 AI 來(lái)改善殘疾人士的生活環(huán)境。就像他所說(shuō)的,“我可以選擇用這一種與我自己最相關(guān)的方式,從個(gè)人經(jīng)驗(yàn)來(lái)理解許多盲人的問(wèn)題,并且用自己的專業(yè)來(lái)提供協(xié)助。”

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉