計算機生成的大腦圖像美國的研究人員跟蹤了人們說話時的神經(jīng)數(shù)據(jù)。
讀心術(shù)離現(xiàn)實又近了一步:科學(xué)家已經(jīng)開發(fā)出可以將大腦活動轉(zhuǎn)化為文本的人工智能。
雖然該系統(tǒng)目前只能在當(dāng)某人大聲說話時檢測到特定神經(jīng)模式,但專家表示,它最終可能會幫助那些不能說話或打字的病人進(jìn)行交流,比如那些患有閉鎖綜合癥的病人。
舊金山加利福尼亞大學(xué)的約瑟夫·馬金博士(Dr Joseph Makin)是這項研究的合著者,他說:“我們還沒有做到這一點,但我們認(rèn)為這可能是聲音“假肢”的基礎(chǔ)?!?/p>
Makin和他的同事們在《自然神經(jīng)科學(xué)》(Nature Neuroscience)雜志上發(fā)表文章[1],揭示了他們是如何開發(fā)這個系統(tǒng)的。首先招募了四名參與者,然后在他們的大腦中植入了電極陣列來監(jiān)測神經(jīng)元的變化。
這些參與者被要求大聲朗讀50個句子,包括“蒂娜·特納是一個流行歌手”和“那些小偷偷走了30個珠寶”。研究小組在他們說話時追蹤他們的腦部神經(jīng)活動。
然后,這些數(shù)據(jù)被輸入一個機器學(xué)習(xí)算法,這是一種人工智能系統(tǒng),可以將每個口語句子的大腦活動數(shù)據(jù)轉(zhuǎn)換成一串?dāng)?shù)字。
為了確保這些數(shù)字只與語言有關(guān),該系統(tǒng)將一小塊大腦活動數(shù)據(jù)預(yù)測的聲音與實際錄制的聲音進(jìn)行了比較。然后,這串?dāng)?shù)字被輸入到系統(tǒng)的第二部分,系統(tǒng)會將其轉(zhuǎn)換成一系列的單詞。
起初,系統(tǒng)給出的都是毫無意義的句子。但是,當(dāng)系統(tǒng)將每個單詞序列與實際大聲朗讀的句子進(jìn)行比較時,它得到了改進(jìn),了解了數(shù)字串與單詞之間的關(guān)系,以及哪些單詞容易相互跟隨。
隨后,研究小組對該系統(tǒng)進(jìn)行了測試,僅根據(jù)說話時大腦的活動就生成了書面文本。
但這個系統(tǒng)目前并不完美。比如,《音樂家們的絕妙和聲》被編譯為《菠菜是名歌手》,《一卷靠墻的鐵絲》被編譯為《羅賓會穿黃百合嗎》。
然而,該團(tuán)隊發(fā)現(xiàn),新系統(tǒng)的準(zhǔn)確性遠(yuǎn)遠(yuǎn)高于以前的方法。雖然準(zhǔn)確性因人而異,但對于一個參與者來說,平均每個句子只有3%需要更正——高于專業(yè)人工抄寫員5%的單詞錯誤率。但是,該團(tuán)隊強調(diào),與后者不同,該算法只能處理少量的句子。
Makin說:“如果你試圖跳出(使用的50個句子)這個范圍,解碼就會變得更糟?!彼a充說,這套系統(tǒng)可能需要結(jié)合學(xué)習(xí)特定的句子、從大腦活動中識別單詞以及識別英語中的一般模式。
該團(tuán)隊還發(fā)現(xiàn),在一名參與者的數(shù)據(jù)上訓(xùn)練算法,意味著從最終用戶那里需要的訓(xùn)練數(shù)據(jù)會更少——這可能使訓(xùn)練對患者來說不那么繁重。
任教于馬斯特里赫特大學(xué)的Christian Herff 博士是這個領(lǐng)域的專家,沒有參與這項研究。他說這項研究著實令人興奮,因為該系統(tǒng)對每個參與者使用的訓(xùn)練數(shù)據(jù)不到40分鐘,而且只收集了有限的句子,而不是通常所需的數(shù)百萬小時。
“通過這樣做,他們達(dá)到了迄今為止尚未達(dá)到的準(zhǔn)確性水平,”他說。
然而,他指出,該系統(tǒng)還不能用于許多嚴(yán)重殘疾患者,因為它依賴于人們大聲說出一個句子時所記錄的大腦活動。
他說:“當(dāng)然,這是一項了不起的研究,但那些人也可以使用‘OK Google’?!薄斑@不是思想的翻譯,而是涉及語言的大腦活動?!?/p>
Herff說,人們現(xiàn)在還不用擔(dān)心別人會讀到他們的想法:大腦電極必須被植入,而想象中的語言和內(nèi)心的聲音是非常不同的。
但是謝菲爾德大學(xué)的腦機接口專家Mahnaz Arvaneh博士說,現(xiàn)在考慮倫理問題很重要。她說:“我們?nèi)匀浑x機器能夠讀懂我們的想法非常、非常遙遠(yuǎn)。但這并不意味著我們不應(yīng)該考慮它?!?/p>