大腦活動(dòng)可以利用人工智能來(lái)變成文本?
計(jì)算機(jī)生成的大腦圖像美國(guó)的研究人員跟蹤了人們說(shuō)話時(shí)的神經(jīng)數(shù)據(jù)。
讀心術(shù)離現(xiàn)實(shí)又近了一步:科學(xué)家已經(jīng)開(kāi)發(fā)出可以將大腦活動(dòng)轉(zhuǎn)化為文本的人工智能。
雖然該系統(tǒng)目前只能在當(dāng)某人大聲說(shuō)話時(shí)檢測(cè)到特定神經(jīng)模式,但專家表示,它最終可能會(huì)幫助那些不能說(shuō)話或打字的病人進(jìn)行交流,比如那些患有閉鎖綜合癥的病人。
舊金山加利福尼亞大學(xué)的約瑟夫·馬金博士(Dr Joseph Makin)是這項(xiàng)研究的合著者,他說(shuō):“我們還沒(méi)有做到這一點(diǎn),但我們認(rèn)為這可能是聲音“假肢”的基礎(chǔ)。”
Makin和他的同事們?cè)凇蹲匀簧窠?jīng)科學(xué)》(Nature Neuroscience)雜志上發(fā)表文章[1],揭示了他們是如何開(kāi)發(fā)這個(gè)系統(tǒng)的。首先招募了四名參與者,然后在他們的大腦中植入了電極陣列來(lái)監(jiān)測(cè)神經(jīng)元的變化。
這些參與者被要求大聲朗讀50個(gè)句子,包括“蒂娜·特納是一個(gè)流行歌手”和“那些小偷偷走了30個(gè)珠寶”。研究小組在他們說(shuō)話時(shí)追蹤他們的腦部神經(jīng)活動(dòng)。
然后,這些數(shù)據(jù)被輸入一個(gè)機(jī)器學(xué)習(xí)算法,這是一種人工智能系統(tǒng),可以將每個(gè)口語(yǔ)句子的大腦活動(dòng)數(shù)據(jù)轉(zhuǎn)換成一串?dāng)?shù)字。
為了確保這些數(shù)字只與語(yǔ)言有關(guān),該系統(tǒng)將一小塊大腦活動(dòng)數(shù)據(jù)預(yù)測(cè)的聲音與實(shí)際錄制的聲音進(jìn)行了比較。然后,這串?dāng)?shù)字被輸入到系統(tǒng)的第二部分,系統(tǒng)會(huì)將其轉(zhuǎn)換成一系列的單詞。
起初,系統(tǒng)給出的都是毫無(wú)意義的句子。但是,當(dāng)系統(tǒng)將每個(gè)單詞序列與實(shí)際大聲朗讀的句子進(jìn)行比較時(shí),它得到了改進(jìn),了解了數(shù)字串與單詞之間的關(guān)系,以及哪些單詞容易相互跟隨。
隨后,研究小組對(duì)該系統(tǒng)進(jìn)行了測(cè)試,僅根據(jù)說(shuō)話時(shí)大腦的活動(dòng)就生成了書(shū)面文本。
但這個(gè)系統(tǒng)目前并不完美。比如,《音樂(lè)家們的絕妙和聲》被編譯為《菠菜是名歌手》,《一卷靠墻的鐵絲》被編譯為《羅賓會(huì)穿黃百合嗎》。
然而,該團(tuán)隊(duì)發(fā)現(xiàn),新系統(tǒng)的準(zhǔn)確性遠(yuǎn)遠(yuǎn)高于以前的方法。雖然準(zhǔn)確性因人而異,但對(duì)于一個(gè)參與者來(lái)說(shuō),平均每個(gè)句子只有3%需要更正——高于專業(yè)人工抄寫(xiě)員5%的單詞錯(cuò)誤率。但是,該團(tuán)隊(duì)強(qiáng)調(diào),與后者不同,該算法只能處理少量的句子。
Makin說(shuō):“如果你試圖跳出(使用的50個(gè)句子)這個(gè)范圍,解碼就會(huì)變得更糟?!彼a(bǔ)充說(shuō),這套系統(tǒng)可能需要結(jié)合學(xué)習(xí)特定的句子、從大腦活動(dòng)中識(shí)別單詞以及識(shí)別英語(yǔ)中的一般模式。
該團(tuán)隊(duì)還發(fā)現(xiàn),在一名參與者的數(shù)據(jù)上訓(xùn)練算法,意味著從最終用戶那里需要的訓(xùn)練數(shù)據(jù)會(huì)更少——這可能使訓(xùn)練對(duì)患者來(lái)說(shuō)不那么繁重。
任教于馬斯特里赫特大學(xué)的Christian Herff 博士是這個(gè)領(lǐng)域的專家,沒(méi)有參與這項(xiàng)研究。他說(shuō)這項(xiàng)研究著實(shí)令人興奮,因?yàn)樵撓到y(tǒng)對(duì)每個(gè)參與者使用的訓(xùn)練數(shù)據(jù)不到40分鐘,而且只收集了有限的句子,而不是通常所需的數(shù)百萬(wàn)小時(shí)。
“通過(guò)這樣做,他們達(dá)到了迄今為止尚未達(dá)到的準(zhǔn)確性水平,”他說(shuō)。
然而,他指出,該系統(tǒng)還不能用于許多嚴(yán)重殘疾患者,因?yàn)樗蕾囉谌藗兇舐曊f(shuō)出一個(gè)句子時(shí)所記錄的大腦活動(dòng)。
他說(shuō):“當(dāng)然,這是一項(xiàng)了不起的研究,但那些人也可以使用‘OK Google’?!薄斑@不是思想的翻譯,而是涉及語(yǔ)言的大腦活動(dòng)。”
Herff說(shuō),人們現(xiàn)在還不用擔(dān)心別人會(huì)讀到他們的想法:大腦電極必須被植入,而想象中的語(yǔ)言和內(nèi)心的聲音是非常不同的。
但是謝菲爾德大學(xué)的腦機(jī)接口專家Mahnaz Arvaneh博士說(shuō),現(xiàn)在考慮倫理問(wèn)題很重要。她說(shuō):“我們?nèi)匀浑x機(jī)器能夠讀懂我們的想法非常、非常遙遠(yuǎn)。但這并不意味著我們不應(yīng)該考慮它。”