AI會(huì)變得越來越人性化,擁抱、做菜、打架無所不能
據(jù)報(bào)道,谷歌正在教AI人類如何擁抱、做菜和打架??萍嫉陌l(fā)達(dá),AI技術(shù)也在不斷地提升?,F(xiàn)在的AI還擁有了一個(gè)人類的數(shù)據(jù)庫,我們可以現(xiàn)象未來的AI會(huì)變得越來越人性。
谷歌,Youtube的所有者,在十月十九日宣布他們有了一個(gè)新的電影片段數(shù)據(jù)庫,將被用來幫助機(jī)器理解人類在生活中的舉止。這個(gè)數(shù)據(jù)庫的名字叫做AVA,而里面的視頻看起來也和正常的沒有什么不同。這些視頻大多三秒左右,里面的人在正常地喝酒做飯。但是每一個(gè)片段都有一個(gè)綁定文檔將機(jī)器需要學(xué)習(xí)的人物的動(dòng)作標(biāo)記出來,并描述出主人公的姿勢,以及他們正在接觸的是人還是物體。還記得你小時(shí)候大人指著一只狗告訴你“那是一條狗”嗎?這一數(shù)據(jù)庫就是其人工智能版本。
當(dāng)視頻中有超過一個(gè)人時(shí),每個(gè)人都有他們自己的標(biāo)簽。這樣,算法可以了解到在正常社交中兩個(gè)人見面是需要握手的。
這一科技可以幫助谷歌分析Youtube上成千上萬的視頻內(nèi)容。他可以根據(jù)你正在看什么來為你推薦廣告或者進(jìn)行內(nèi)容審核。其最終的目標(biāo)是教會(huì)計(jì)算機(jī)“社交視覺智能”。在一篇關(guān)于這個(gè)項(xiàng)目的研究報(bào)告中,作者解釋道,所謂“社交視覺智能”指的是可以理解人們在做什么,他們將要做什么,以及他們想要達(dá)成什么目標(biāo)。
AVA這一數(shù)據(jù)庫有著57600條標(biāo)好標(biāo)簽的視頻,覆蓋了80種動(dòng)作。例如站立,說話,聆聽和行走這樣的簡單動(dòng)作,每一個(gè)都在數(shù)據(jù)庫中有著超過一萬條視頻標(biāo)簽。同時(shí),研究者也在論文中承認(rèn),使用電影片段確實(shí)也帶來了一些副作用,因?yàn)殡娪爸谱髦幸恍﹦?dòng)作總是會(huì)被過分戲劇化地詮釋,而并不能完全接近日常生活。
“我們并沒有認(rèn)為這些數(shù)據(jù)是完美的,”研究者如此寫道,“但是這些數(shù)據(jù)比用戶自行上傳的,例如如何逗寵物,如何給孩子過生日這一類視頻要接近日常生活的多。”
論文表明他們正在試圖找到“不同國家最優(yōu)秀的表演者,”但是并沒有詳細(xì)闡述這一數(shù)據(jù)庫是否有種族歧視和性別歧視。