你還在那擔(dān)心拍照時眨眼嗎?Facebook的AI新研究讓你“眼界大開”
現(xiàn)代生活中,我們P圖的方式多種多樣,比如去除紅眼、鏡頭曝光,等等。但是,拍照眨眼仍然很難處理。不過,最近Facebook的一項AI新研究能夠讓照片中閉眼的你“眼界大開”。這一技術(shù)被譽(yù)為智能“內(nèi)畫”(intelligent in-painTIng),用開眼代替閉眼只是其中的用例之一。簡單來說,就是程序會自動向空間填充那些它認(rèn)為本該存在里面的東西。Adobe目前已經(jīng)在”上下文感知檢索“中充分利用了這項技術(shù),讓用戶能夠無縫替換掉那些不想要的功能。
當(dāng)然,替換眼睛是這項技術(shù)面臨的挑戰(zhàn)之一。因為,眼睛具有復(fù)雜性和多變性的特點(diǎn),所以系統(tǒng)很難改變或者是創(chuàng)建此類內(nèi)容。
不過,由于Facebook掌握巨大的圖片數(shù)據(jù)庫,擁有許多人眨眼的照片,所以決定要嘗試去破解這個難題。
想要實(shí)現(xiàn)這一點(diǎn),就需要依靠生成式對抗性網(wǎng)絡(luò)(GeneraTIve Adversarial Network,以下簡稱GAN),其本質(zhì)上就是一個機(jī)器學(xué)習(xí)系統(tǒng)。這個系統(tǒng)要學(xué)會欺騙自己,讓自己覺得所造的事物是真實(shí)可靠的。在GAN中,系統(tǒng)的其中一部分要學(xué)習(xí)去識別內(nèi)容,而另一部分則負(fù)責(zé)去創(chuàng)造內(nèi)容。當(dāng)然,內(nèi)容創(chuàng)造會根據(jù)內(nèi)容識別的反饋信息來進(jìn)行。
在這一條件下,這個網(wǎng)絡(luò)既能夠識別眼周環(huán)境,同時也能創(chuàng)建一雙眼睛。正如上圖所示,目前這項技術(shù)已經(jīng)可以使用了,但是仍有一些不太理想的地方。系統(tǒng)似乎只是單一地復(fù)制粘貼人類的眼睛,但是并沒有考慮到圖像的一致性。
機(jī)器就是這么傻,他們沒有辦法理解的是,當(dāng)人們睜開眼睛時,眼周的顏色并不會隨之改變?;蛘邠Q句話說,機(jī)器對于眼睛、顏色等信息都沒有直觀理解。
在Facebook研究人員輸入的樣本數(shù)據(jù)中,實(shí)驗對象的眼睛都是睜開的。這樣一來,GAN就能了解到眼睛在人體的位置、特定的形狀,以及顏色,等等。
結(jié)果顯示,并沒有明顯的色差或者是縫合痕跡。這是因為,系統(tǒng)中負(fù)責(zé)識別的部分非常清楚,真實(shí)的人類不長那樣兒。
在測試中,人們經(jīng)常會沒辦法判斷,哪些照片是真的睜眼,哪些只是系統(tǒng)模擬的睜眼照片;誤判率高達(dá)一半以上。
當(dāng)然,這個系統(tǒng)也并非十全十美。在某些情況下,其仍然會出現(xiàn)失誤。比如說,當(dāng)一個人的眼睛被頭發(fā)遮蓋住,或者是顏色矯正出現(xiàn)偏差的時候,系統(tǒng)生成的照片中就會出現(xiàn)一些奇怪的陰影。當(dāng)然,這些問題都是可以解決的。
可以想象,當(dāng)Facebook未來某天在平臺上審閱用戶照片的時候,如果一旦發(fā)現(xiàn)某個用戶的照片閉眼了,那么它就會自動用這個系統(tǒng)把用戶眼睛打開…說實(shí)話,這是有點(diǎn)讓人毛骨悚然。但是,至少這個系統(tǒng)可能可以拯救你相冊里面的不少照片。