你還在那擔心拍照時眨眼嗎？Facebook的AI新研究讓你“眼界大開”

時間：2020-07-14 13:45:02

關(guān)鍵字： AI facebook 人工智能

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 現(xiàn)代生活中，我們P圖的方式多種多樣，比如去除紅眼、鏡頭曝光，等等。但是，拍照眨眼仍然很難處理。不過，最近Facebook的一項AI新研究能夠讓照片中閉眼的你“眼界大開”。

現(xiàn)代生活中，我們P圖的方式多種多樣，比如去除紅眼、鏡頭曝光，等等。但是，拍照眨眼仍然很難處理。不過，最近Facebook的一項AI新研究能夠讓照片中閉眼的你“眼界大開”。這一技術(shù)被譽為智能“內(nèi)畫”（intelligent in－painTIng），用開眼代替閉眼只是其中的用例之一。簡單來說，就是程序會自動向空間填充那些它認為本該存在里面的東西。Adobe目前已經(jīng)在”上下文感知檢索“中充分利用了這項技術(shù)，讓用戶能夠無縫替換掉那些不想要的功能。

當然，替換眼睛是這項技術(shù)面臨的挑戰(zhàn)之一。因為，眼睛具有復雜性和多變性的特點，所以系統(tǒng)很難改變或者是創(chuàng)建此類內(nèi)容。

不過，由于Facebook掌握巨大的圖片數(shù)據(jù)庫，擁有許多人眨眼的照片，所以決定要嘗試去破解這個難題。

想要實現(xiàn)這一點，就需要依靠生成式對抗性網(wǎng)絡(luò)（GeneraTIve Adversarial Network，以下簡稱GAN），其本質(zhì)上就是一個機器學習系統(tǒng)。這個系統(tǒng)要學會欺騙自己，讓自己覺得所造的事物是真實可靠的。在GAN中，系統(tǒng)的其中一部分要學習去識別內(nèi)容，而另一部分則負責去創(chuàng)造內(nèi)容。當然，內(nèi)容創(chuàng)造會根據(jù)內(nèi)容識別的反饋信息來進行。

在這一條件下，這個網(wǎng)絡(luò)既能夠識別眼周環(huán)境，同時也能創(chuàng)建一雙眼睛。正如上圖所示，目前這項技術(shù)已經(jīng)可以使用了，但是仍有一些不太理想的地方。系統(tǒng)似乎只是單一地復制粘貼人類的眼睛，但是并沒有考慮到圖像的一致性。

機器就是這么傻，他們沒有辦法理解的是，當人們睜開眼睛時，眼周的顏色并不會隨之改變。或者換句話說，機器對于眼睛、顏色等信息都沒有直觀理解。

在Facebook研究人員輸入的樣本數(shù)據(jù)中，實驗對象的眼睛都是睜開的。這樣一來，GAN就能了解到眼睛在人體的位置、特定的形狀，以及顏色，等等。

結(jié)果顯示，并沒有明顯的色差或者是縫合痕跡。這是因為，系統(tǒng)中負責識別的部分非常清楚，真實的人類不長那樣兒。

在測試中，人們經(jīng)常會沒辦法判斷，哪些照片是真的睜眼，哪些只是系統(tǒng)模擬的睜眼照片；誤判率高達一半以上。

當然，這個系統(tǒng)也并非十全十美。在某些情況下，其仍然會出現(xiàn)失誤。比如說，當一個人的眼睛被頭發(fā)遮蓋住，或者是顏色矯正出現(xiàn)偏差的時候，系統(tǒng)生成的照片中就會出現(xiàn)一些奇怪的陰影。當然，這些問題都是可以解決的。

可以想象，當Facebook未來某天在平臺上審閱用戶照片的時候，如果一旦發(fā)現(xiàn)某個用戶的照片閉眼了，那么它就會自動用這個系統(tǒng)把用戶眼睛打開…說實話，這是有點讓人毛骨悚然。但是，至少這個系統(tǒng)可能可以拯救你相冊里面的不少照片。