谷歌利用AI技術(shù)更換視頻背景

時(shí)間：2020-07-23 13:06:02

關(guān)鍵字： ai技術(shù) 谷歌

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 視頻現(xiàn)已成為人們娛樂(lè)生活中不可或缺的一種方式，為了提升用戶在拍攝時(shí)的體驗(yàn)，國(guó)內(nèi)外都在不斷迭代更新著自家應(yīng)用。近期谷歌的AI技術(shù)又帶來(lái)了一種全新玩法，通過(guò)AI技術(shù)實(shí)現(xiàn)對(duì)視頻背景的分離。視

視頻現(xiàn)已成為人們娛樂(lè)生活中不可或缺的一種方式，為了提升用戶在拍攝時(shí)的體驗(yàn)，國(guó)內(nèi)外都在不斷迭代更新著自家應(yīng)用。近期谷歌的AI技術(shù)又帶來(lái)了一種全新玩法，通過(guò)AI技術(shù)實(shí)現(xiàn)對(duì)視頻背景的分離。

視頻分割（摳像）技術(shù)是并不是什么新鮮事物，過(guò)去一些導(dǎo)演和視頻制作者常用該技術(shù)對(duì)場(chǎng)景的前景與背景進(jìn)行分離，通過(guò)此類手法，能夠讓視頻中一些內(nèi)容變得更為‘吸睛’。

只不過(guò)以往這是一種耗時(shí)的人工行為，現(xiàn)今谷歌通過(guò)機(jī)器學(xué)習(xí)能力，對(duì)成千上萬(wàn)的圖像進(jìn)行了注釋，包括頭發(fā)，眼鏡，頸部，皮膚，嘴唇等前景元素的像素精確位置。也就是說(shuō)，只需要通過(guò)簡(jiǎn)單的觸控操作，便可進(jìn)行背景更換。

為了提高速度，谷歌在網(wǎng)絡(luò)體系結(jié)構(gòu)上也進(jìn)行了改進(jìn)，使用四倍以上的大卷積內(nèi)核來(lái)檢測(cè)高分辨率RGB輸入幀上的對(duì)象特征，并將網(wǎng)絡(luò)中間的信道擠壓四倍，將256個(gè)信道減少到64個(gè)的同時(shí)也不會(huì)對(duì)質(zhì)量產(chǎn)生影響。

目前該技術(shù)已在YouTube上進(jìn)行了測(cè)試，遺憾的是僅對(duì)少數(shù)YouTube播主進(jìn)行了開(kāi)放，同時(shí)這些主播還要是YouTube Stories的用戶。