日本科學(xué)家公布研究人工智能的結(jié)果:讓 AI 學(xué)會(huì)了「譯碼」
試著想像一下,計(jì)算機(jī)可以讀取你在看著什么、或想著什么的情況,雖然聽起來非??苹?,但在日本團(tuán)隊(duì)的研究下,這種像是電影劇情的未來正逐漸成真。
2017 年 12 月底時(shí),日本京都大學(xué)神谷研究室 4 位科學(xué)家公布了他們研究人工智能(AI)的結(jié)果,雖然還只是起步,但他們確實(shí)開發(fā)出讓 AI 學(xué)會(huì)了「譯碼」人們腦波的新技術(shù)。
團(tuán)隊(duì)創(chuàng)造的 AI 在讀取人的腦波后,根據(jù)對(duì)象腦波中顯示的影像,便能創(chuàng)造出相應(yīng)但較為模糊的圖片,這種從人類大腦活動(dòng)中可視化感知過程的技術(shù),團(tuán)隊(duì)將其稱呼為「深度圖像重建」(deep image reconstrucTIon)。
▲一旦大腦波動(dòng)被掃描,計(jì)算機(jī)便會(huì)反向譯碼這些訊息,進(jìn)而產(chǎn)生一個(gè)可視化的主體圖片,圖片顯示 AI 解讀并重建信息的過程。
神谷之康(Yukiyasu Kamitani)教授向 CNBC 表示,團(tuán)隊(duì)一直都在研究如何透過觀察人的大腦活動(dòng),來重建、重現(xiàn)人們所看到影像的方法,但在過去研究中,團(tuán)隊(duì)曾假設(shè)一個(gè)圖片是由像素(pixels)或簡單形狀組成的, 而現(xiàn)在他們已經(jīng)知道人腦的運(yùn)作方式并非如此。
「現(xiàn)在我們已經(jīng)知道,人們大腦處理視覺訊息的方式,是分層次的提取不同等級(jí)的特征,或是不同復(fù)雜程度的組成部分。 」
透過理解這一點(diǎn),研究中建立的神經(jīng)網(wǎng)絡(luò)或 AI 模型將可以用來代表大腦分層結(jié)構(gòu)處理的情況,進(jìn)而讓 AI 能更好的去偵測、理解大腦所見到的物體,而不僅僅是像過去一樣只能以二進(jìn)制像素表示。
在深度圖像重建的算法中,AI 會(huì)先加載隨機(jī)圖片,并開始根據(jù)腦波譯碼中讀取到的特征逐漸去改變像素值。 除了深度神經(jīng)網(wǎng)絡(luò)(DNN)和機(jī)器學(xué)習(xí)領(lǐng)域的圖像生成技術(shù),團(tuán)隊(duì)還用了深度生成網(wǎng)絡(luò)(Deep Generator Network, DGN)來確保圖片看起來自然。
▲▼首圖為只使用 DNN 譯碼腦波的情況,上圖則是運(yùn)用 DNN 與隨機(jī)圖片,下圖則是運(yùn)用 DNN、DGN 與隨機(jī)圖片。
在研究期間,團(tuán)隊(duì)分別針對(duì)自然景象、人造幾何形狀和字母進(jìn)行了測試。 在一些情況中,受試者在觀看圖片時(shí),計(jì)算機(jī)便對(duì)腦波進(jìn)行掃描,而在其他情況中,計(jì)算機(jī)則是在受試者回想剛剛展示的圖片時(shí)進(jìn)行解析。
與過去的方法不同,即使人們只是回憶起圖片,深度圖像重建 AI 也能夠試著建構(gòu)出相對(duì)應(yīng)可視化圖片來,但由于大腦活化不足,AI 系統(tǒng)在這種情況下的分析也必須花上更長一些時(shí)間。
透過不斷的猜測腦波數(shù)據(jù)對(duì)應(yīng)的形象化,AI 從眾多的數(shù)據(jù)中持續(xù)學(xué)習(xí)。 嚴(yán)格來說,深度圖像重建的 AI 并不能真正「看見」人的思想,但它確實(shí)知道當(dāng)你在想什么時(shí),腦波是什么樣子的。
盡管從圖片看來,目前深度圖像重建 AI 讀取的效果仍十分有限,但隨著精準(zhǔn)度不斷改良,這項(xiàng)技術(shù)的潛在應(yīng)用價(jià)值將令人難以想象。
▲相較自然圖像,字母的譯碼已經(jīng)幾乎能夠辨識(shí)(沒有運(yùn)用 DGN 的情況)。
運(yùn)用這種可視化技術(shù),人們或許將能簡單透過想象來繪畫或制作藝術(shù),就連夢境也可能可以透過計(jì)算機(jī)來形象化。 對(duì)于一些飽受幻覺困擾的精神疾病患者來說,也能夠得到更多相對(duì)應(yīng)的外在協(xié)助。
神谷之康教授認(rèn)為,隨著 AI 技術(shù)和腦機(jī)接口發(fā)展,有朝一日,或許純粹透過意念和想象的溝通將有望實(shí)現(xiàn)。