在某些事情上機(jī)器人可能比你更懂
在美劇《硅谷》中,曾出現(xiàn)一個(gè)基于深度學(xué)習(xí)來(lái)識(shí)別熱狗的 app : Not Hotdog ,可過(guò)去 AI 要識(shí)別一種食物已經(jīng)不容易,但在未來(lái)你每一個(gè)細(xì)微的動(dòng)作可能都逃不過(guò) AI 的眼睛。
最近 Netflix 的高級(jí)數(shù)據(jù)科技學(xué)家 Amir Ziai 發(fā)布了一項(xiàng)新的研究,用 AI 識(shí)別電影中接吻場(chǎng)景,這項(xiàng)技術(shù)看似無(wú)聊,但對(duì)于視頻行業(yè)卻有著重要的意義。一般來(lái)說(shuō)接吻場(chǎng)景會(huì)出現(xiàn)在影視作品高潮和關(guān)鍵節(jié)點(diǎn),有了這項(xiàng)技術(shù),視頻網(wǎng)站可以直接在視頻中標(biāo)記,方便用戶檢索和查看,甚至可以自動(dòng)剪輯成視頻集錦推送給用戶。
此外如果你是個(gè)戀愛(ài)新手,或許還能通過(guò)這個(gè)工具快速學(xué)習(xí)一下電影中的那些接吻技巧,速成接吻十八式(誤)。但是要讓機(jī)器看懂人是怎么接吻并容易,Amir Ziai 建立了一個(gè) 2.3TB 的數(shù)據(jù)庫(kù),包含了從 1915 年到 2016 年的 600 部好萊塢電影,包括不同的類型,每部大小在 200MB 到 12 GB 之間。
Amir Ziai 選取了其中 100 部電影進(jìn)行手動(dòng)標(biāo)記,總共標(biāo)記 263 個(gè)接吻片段和 363 個(gè)非接吻片段,時(shí)長(zhǎng)從 10 秒到 120 秒不等,而且每個(gè)標(biāo)記片段都會(huì)提取圖像特征和音頻特征。也就是說(shuō),AI 鑒定電影中的角色是否接吻,除了「看畫(huà)面」,還會(huì)「聽(tīng)聲音」,這有助于提高識(shí)別的準(zhǔn)確率。經(jīng)過(guò)測(cè)試,Amir Ziai 發(fā)現(xiàn)這套系統(tǒng)的識(shí)別接吻的準(zhǔn)確率達(dá)到 95%。
正如 Amir Ziai 在研究中采取的方法,目前訓(xùn)練 AI 還離不開(kāi)人工。類似的技術(shù)其實(shí)在優(yōu)酷等視頻網(wǎng)站已經(jīng)開(kāi)始應(yīng)用,甚至還出現(xiàn)一種叫做「吻戲鑒定師」的新職業(yè)。去年優(yōu)酷一個(gè) 29 歲的「吻戲鑒定師」吉恒杉就曾登上熱搜,據(jù)吉恒杉介紹,為了教會(huì)計(jì)算機(jī)識(shí)別接吻等場(chǎng)景,需要從圖片庫(kù)和視頻中截取數(shù)千幅照片,一張一張標(biāo)記「接吻」的畫(huà)面。
光接吻場(chǎng)景就需要標(biāo)注 2000 多張照片,目前已經(jīng)為「接吻」這個(gè)標(biāo)簽做了兩萬(wàn)多張圖像的標(biāo)注。據(jù)稱以目前阿里巴巴的視頻識(shí)別技術(shù),可以在 10 秒對(duì) 5 分鐘的視頻進(jìn)行識(shí)別標(biāo)記。以電視劇《三生三世十里桃花》,機(jī)器會(huì)將單集 50 分鐘的視頻切割成 3000 幀圖片,只要 5 秒鐘就能挑出楊冪和趙又廷的吻戲。
目前類似的技術(shù)正在向更多場(chǎng)景拓展,比如識(shí)別體育賽事中進(jìn)球、投籃、慶祝等動(dòng)作,甚至應(yīng)用在視頻之外的更多場(chǎng)景。據(jù)《華爾街日?qǐng)?bào)》報(bào)道,中國(guó)平安正在使用面部識(shí)別系統(tǒng)識(shí)別客戶臉上的微表情,以決定是否接受他們的投保,從 2016 年開(kāi)始中國(guó)平安已經(jīng)將這項(xiàng)技術(shù)應(yīng)用于消費(fèi)金融部門(mén),作為發(fā)放貸款時(shí)風(fēng)險(xiǎn)評(píng)估的一部分。
有意思的是,根據(jù)國(guó)際權(quán)威人臉識(shí)別數(shù)據(jù)庫(kù) LFW 2107 年的一份測(cè)試結(jié)果,中國(guó)平安旗下平安科技的人臉識(shí)別技術(shù)以 99.8% 的識(shí)別精度和最低的波動(dòng)幅度領(lǐng)先蘋(píng)果、Google 等科技巨頭,位居世界第一。而日本一家人工智能公司 Vaak 開(kāi)發(fā)出的一款 AI 軟件,能通過(guò)分析顧客的神情和肢體動(dòng)作,從而找出潛在的扒手,并提醒店員注意,去年還在一家便利店就成功識(shí)別出一名可疑的顧客。
這種 AI 分析技術(shù)除了可用于零售商,未來(lái)還能在火車站臺(tái)等公眾場(chǎng)所預(yù)防自殺 ,將有自殺傾向的人檢測(cè)出來(lái),提前阻止跳軌自殺等悲劇發(fā)生。
從靜態(tài)的圖片到動(dòng)態(tài)的畫(huà)面,AI 識(shí)別的能力越來(lái)越強(qiáng),但這也引發(fā)了一些人的擔(dān)憂。美國(guó)公民自由聯(lián)盟(ACLU)最近在一份報(bào)告中指出,人工智能技術(shù)的進(jìn)步使得攝像頭更加聰明,可能會(huì)讓我們的每個(gè)動(dòng)作都被識(shí)別,如果不加以控制,可能會(huì)引發(fā)不少隱私問(wèn)題。
上周微軟主動(dòng)刪除了其最大的公共人臉識(shí)別數(shù)據(jù)庫(kù) MS Celeb,可能就是擔(dān)心這些數(shù)據(jù)和相關(guān)技術(shù)被濫用,但這不會(huì)影響 AI 技術(shù)不斷進(jìn)步,在不久的將來(lái)還可能引發(fā)更多的爭(zhēng)議。