谷歌大腦 將有碼還原成無(wú)碼
“谷歌大腦”是谷歌旗下人工智能部門(mén),近日設(shè)計(jì)了一款全新軟件,可以把馬賽克一樣的源圖片還原成清晰圖片。
簡(jiǎn)而言之,原本“打碼”的照片現(xiàn)在也可以輕松變成無(wú)碼高清了。
首先來(lái)看一張圖,左邊一列是分辨率為8×8的打碼圖片,中間一列是谷歌大腦軟件還原的圖片,而右邊一列則是真正的原始圖片。實(shí)際效果非常接近原始圖片。
眾所周知,不可能制作出比源圖片更加詳細(xì)的圖片,那么谷歌大腦是如何做到的呢?他們將兩個(gè)神經(jīng)網(wǎng)絡(luò)聰明地整合到一起。
第一部分是條件網(wǎng)絡(luò)(conditioning network),它會(huì)將8×8的圖片與高清圖片進(jìn)行對(duì)比,將其他高清圖片縮小到8×8的分辨率,然后進(jìn)行匹配。
第二部分是優(yōu)先網(wǎng)絡(luò)(prior network),使用PixelCNN(像素神經(jīng)網(wǎng)絡(luò))向8×8的源圖片中增加真實(shí)的高清細(xì)節(jié)。在這個(gè)案例中,優(yōu)先網(wǎng)絡(luò)其實(shí)是吸收了大量名人和臥室照片。然后,當(dāng)需要解析源圖片時(shí),便會(huì)從其已知的圖片中尋找與之匹配的新像素,并將添加進(jìn)去。
例如,圖片頂部有一個(gè)棕色像素,而優(yōu)先網(wǎng)絡(luò)或許認(rèn)為那是一條眉毛:于是,當(dāng)要解析圖片時(shí),就會(huì)用眉毛形狀的棕色像素填補(bǔ)進(jìn)去。
為了制作出最終的無(wú)碼高清圖片,需要融合這兩個(gè)神經(jīng)網(wǎng)絡(luò)輸出的數(shù)據(jù),最終結(jié)果往往會(huì)包含一些似是而非的新細(xì)節(jié)。
谷歌大腦的高清還原技術(shù)已經(jīng)在實(shí)際測(cè)試中取得了一定的成功。當(dāng)該團(tuán)隊(duì)向人類(lèi)觀察員呈現(xiàn)真實(shí)的高清明星照和經(jīng)過(guò)電腦還原的照片時(shí),觀察員被騙的比例達(dá)到10%(50%就屬于完美得分)。而在臥室照片中,人類(lèi)觀察員被騙的比例達(dá)到28%。這兩個(gè)得分都遠(yuǎn)高于常規(guī)的雙三次插值放大技術(shù),后者沒(méi)有騙過(guò)任何人類(lèi)觀察員。
需要指出的是,電腦還原的高清圖片并非真實(shí)圖片,它所增加的細(xì)節(jié)只是一種“猜測(cè)”。這便引發(fā)了一些有趣的問(wèn)題,尤其是在監(jiān)控和法醫(yī)領(lǐng)域。這項(xiàng)技術(shù)可以把模糊的嫌疑人照片放大成更加清晰的圖片,但卻無(wú)法得到真正的嫌疑人照片,但仍然可以為警方提供一些幫助。
谷歌大腦和DeepMind是Alphabet的兩大深度學(xué)習(xí)研究機(jī)構(gòu)。前者最近發(fā)布了一些有趣的研究成果,例如,開(kāi)發(fā)了可以自行制作加密算法的人工智能技術(shù)。后者則因?yàn)槠溟_(kāi)發(fā)的AlphaGo去年擊敗全球頂級(jí)圍棋選手李世石而名聲大噪。