首部AI生成科研書籍 來看看機器人是如何寫書的
根據(jù)國外媒體報道,專業(yè)學術出版商Springer Nature表示,該公司已經(jīng)完成了第一本使用機器學習技術生成的專業(yè)研究書籍。
這本名為《鋰離子電池:當前研究的機器生成摘要》的專業(yè)出版物閱讀起來并不輕松。相反,就像它晦澀的書名一樣,這是一本針對對相關主題發(fā)表的同行業(yè)評議論文的總結。它包括引用、引用作品的超鏈接和自動生成的引用內(nèi)容。因此如果你晚上入睡困難,這本書應該能幫你入睡,同時它還可以免費下載和閱讀。
雖然這本書的內(nèi)容令人昏昏欲睡,但它的存在的確令人興奮。Springer Nature的寧舍南伯格(Henning Schoenenberger)在這本書的序言中寫道,這樣的書籍有可能通過自動化來完成乏味的工作,開啟“科學出版的新紀元”。
舍南伯格指出,僅在過去的三年里,就有超過5.3萬篇關于鋰離子電池的研究論文發(fā)表。這對該行業(yè)研究的科學家來說是一種巨大的挑戰(zhàn),很多科學家都嘗試能夠跟上鋰離子電池領域的發(fā)展四度。但現(xiàn)在通過使用人工智能自動掃描和總結大量的論文,并且總結出主要的結論,可以幫你科學家可以節(jié)省更不多的時間,繼續(xù)進行相對比較重要的技術研究。
舍恩伯格表示:“這種新方法允許讀者加快對某一特定研究領域文獻消化過程和速度,而無需親自閱讀數(shù)百篇已經(jīng)發(fā)表的文章。與此同時,如果需要的話讀者還可以直接識別并且尋找某個結論或觀點的原始出處和來源,以便能更深入地挖掘和進一步探索相關主題?!?/p>
盡管最近機器學習的蓬勃發(fā)展大幅提高了計算機生成書面文字的能力,但這些機器人的輸出內(nèi)容仍然受到嚴重限制。它們無法與人類作家所創(chuàng)作出長期的連貫性和嚴謹?shù)慕Y構相提并論,因此像之前媒體報道那樣通過人工智能技術生成的小說或詩歌等努力的結果,往往更多的只是在格式上與人類作品靠近,但無法創(chuàng)造出引人入勝的閱讀體驗,而對于閱讀來說,內(nèi)容本身是更有價值的信息。
人工智能技術目前所能做的事情就是根據(jù)圖書館的現(xiàn)有文獻和內(nèi)容,經(jīng)過數(shù)據(jù)掃描后大量“炮制”出公式化的文字內(nèi)容。例如,在新聞業(yè)中,機器學習技術已經(jīng)被美聯(lián)社等機構用來創(chuàng)建包括足球比賽、地震和金融新聞等程式化消息的報道。在這些主題中,如果需要一些創(chuàng)造力的內(nèi)容,那么就會形成一定的障礙,而人工智能技術目前能完成的也只是機械式的寫作而已。
正如技術專家羅斯古德溫在Springer Nature新書的前言中所引用的那樣:“當我們教會電腦寫作時,電腦不會真正取代我們,就像鋼琴不會取代鋼琴家一樣。從某種程度上來說,電腦只能成為我們的筆,而人類也不僅僅是單純的文字創(chuàng)作,人類是作家中的作家?!?/p>
但在人工智能寫作方面,我們甚至可能還沒有達到真正自動化的新階段。最近來自卡內(nèi)基梅隆大學(Carnegie Mellon)人機交互研究所副教授杰夫比格姆(Jeff Bigham)在接受媒體采訪時表示,這本書并不是人工智能寫作領域中最令人印象深刻的成就。
比格姆說:“把高質(zhì)量的文本輸入進去,然后把摘錄的摘要內(nèi)容一前一后地排出來,然后粗略的進行排版,就能讓它看起來有點條理。事實上,提取摘要的本質(zhì)意味著只要輸入的文本是連貫的,它就會自動以段落的形式連貫起來。但如果要創(chuàng)造出讓人類讀者覺得有閱讀價值的東西,其難度要大得多?!?/p>
事實上,當我們在快速瀏覽這本書籍時,其實不難發(fā)現(xiàn)一些內(nèi)容混亂、不連貫的句子。像“這可能會導致大量的高強調(diào),并從此破裂或分層”這樣的短語不僅在科學上不夠縝密,而且對普通人來說內(nèi)容也讓人費解。因此發(fā)布人工智能生成的學術書籍是一回事,但讓人容易閱讀又是另外一回事。但我們現(xiàn)在必須耐心等待,觀察這種人工智能生成的文字是否真的有用。