眾所周知,AI將是推動未來社會發(fā)展的主力。不久前的10月21日,便有第六屆世界互聯網大會的重要產業(yè)合作對接活動——IDG“AI+5G 賦能科技 引領未來”專場活動在烏鎮(zhèn)互聯網國際會展中心舉行。其以“AI+5G 賦能科技 引領未來”為主題,齊聚行業(yè)大咖,共同探討在5G時代,人工智能的發(fā)展之路,為促進行業(yè)交流、實現產業(yè)合作提供平臺。
縱觀現在的國際市場,外有日本軟銀的孫正義,為了發(fā)展AI成立1000億美金的AI基金,專門投資一些AI領域的公司。內則有如曠視科技、極鏈科技等AI產業(yè)獨角獸,積極進取,開拓新領域。這些都體現出了AI在人們心中地位的加重。
可也有不少人對AI產生了質疑聲,畢竟目前的電腦程序以及所謂的AI,其對我們人類的自然語言只是達到處理的級別。這方面的專業(yè)叫法是自然語言處理NLP,還遠遠達不到我們期望的自然語言理解的程度。
它的實現方式是,從海量的人類自然語言素材里面,統計出詞與詞,字與字,以及詞組成的短語的模式和出現頻率,然后根據這個頻率統計,再結合一段文字上下文邏輯的簡短推理,來找出統計概率最大的結果。再把這個結果作為答案輸出或者根據這個結果尋找統計概率最大的匹配答案。
這樣的運作模式和我們人類理解自然語言的方式有一定的相似,但缺失了很重要的一部分,即詞語背后所指代的事物的背景知識,而這才是理解人類自然的關鍵,所以現在AI界的一個重要挑戰(zhàn)是,如何讓計算機理解我們人類掌握的公共知識,也就是常識。
近期,微軟研究團隊便通過對上下文建模加以研究,得出了一種新的方法。這種方法能夠讓 AI 模型通過上下文的歷史記錄來改寫對話中的最后話語。在一份預先出版的論文中,微軟研究團隊詳細地介紹了他們的工作——為開放領域的對話進行無監(jiān)督的上下文重寫。他們聲稱,在重寫質量和多輪響應生成方面,他們的實驗結果已經達到了最新基準。
正如研究人員所解釋的那樣,對話上下文提出了句子建模中所沒有的挑戰(zhàn),比如主題轉換、共同引用(像他、她、它、他們這種)、長期依賴。大多數系統解決這些問題的方法是在最后一段話中添加關鍵字,或者用 AI 模型學習數字表示,但這種方法往往會遇到障礙,比如無法選擇正確的關鍵詞、無法處理較長的上下文等。
這時候,就是微軟研究團隊的方法的用武之地了。它通過對語境信息的考量,重新制定了對話中的最后一句話;這么做是為了生成一個獨立的話語,既不存在相互參照,也不依賴過去對話的其它話語。
舉個例子,如果將“我討厭喝咖啡。- - 為什么?它挺好喝的啊。”轉化成“為什么會討厭喝咖啡呢?它挺好喝的啊?!?,這就借用了“它”和“為什么”。其中,“它”指代的是對話中提到的咖啡,“為什么”則是“為什么討厭喝咖啡”的縮寫形式。
對此,研究人員設計了一個機器學習系統——上下文重寫網絡,來實現端到端的流程自動化。這個系統是由一個序列到序列模型組成的,它能夠將固定長度的話語映射到固定長度的重寫句子上。并且,它還具有一個獨立的注意力機制,這個機制能夠通過最后話語中的不同單詞來幫助它從上下文中復制單詞。
微軟研究團隊認為,他們的工作朝著更易解釋和更易控制的上下文建模中邁進了一步。另外,該研究團隊還表示,他們的模型可以從嘈雜的語境中提取出重要的關鍵詞,然后將這些關鍵詞插入到最后的話語中,使其不僅變得易于控制和解釋,還有助于將信息直接傳遞到最后的話語中。
這個技術可以幫助人工智能在真正理解人類話語的路上跨出一步,盡管該模型在強化學習后偶爾會變得不穩(wěn)定,不過它依舊顯著地提升了話語的多樣性。此外,微軟今年推出了一款可以識別情緒的工具,根據上傳的圖片就可以分析出情緒特征,但同時微軟也聲明目前這款軟件還只是以娛樂為主,還不能每次都能正確的識別情緒。
“情緒的產生過程會反映在外周器官狀態(tài)變化。比如人受到外界刺激感到恐懼的時候,會出現心跳加速或心律不齊、呼吸短促或停頓和血壓升高等情況。目前,AI深度學習的情緒識別已經從快樂、驚訝、憤怒、悲傷、恐懼和厭惡等基本情緒發(fā)展到了超過二十種更微妙的情緒,例如“愉快的驚訝”、“憤怒的驚訝”、敬畏等。
不可否認,未來已經離我們不遠了。無論我們喜不喜歡、樂不樂意,終有一天AI將能真正讀懂人類的語言、動作、情緒等各類因素。屆時,如何處理好其間可能存在的問題,還需我們提前進行思考。
正如研究人員所解釋的那樣,對話上下文提出了句子建模中所沒有的挑戰(zhàn),比如主題轉換、共同引用(像他、她、它、他們這種)、長期依賴。大多數系統解決這些問題的方法是在最后一段話中添加關鍵字,或者用 AI 模型學習數字表示,但這種方法往往會遇到障礙,比如無法選擇正確的關鍵詞、無法處理較長的上下文等。
這時候,就是微軟研究團隊的方法的用武之地了。它通過對語境信息的考量,重新制定了對話中的最后一句話;這么做是為了生成一個獨立的話語,既不存在相互參照,也不依賴過去對話的其它話語。
舉個例子,如果將“我討厭喝咖啡。- - 為什么?它挺好喝的啊?!鞭D化成“為什么會討厭喝咖啡呢?它挺好喝的啊?!?,這就借用了“它”和“為什么”。其中,“它”指代的是對話中提到的咖啡,“為什么”則是“為什么討厭喝咖啡”的縮寫形式。
對此,研究人員設計了一個機器學習系統——上下文重寫網絡,來實現端到端的流程自動化。這個系統是由一個序列到序列模型組成的,它能夠將固定長度的話語映射到固定長度的重寫句子上。并且,它還具有一個獨立的注意力機制,這個機制能夠通過最后話語中的不同單詞來幫助它從上下文中復制單詞。
微軟研究團隊認為,他們的工作朝著更易解釋和更易控制的上下文建模中邁進了一步。另外,該研究團隊還表示,他們的模型可以從嘈雜的語境中提取出重要的關鍵詞,然后將這些關鍵詞插入到最后的話語中,使其不僅變得易于控制和解釋,還有助于將信息直接傳遞到最后的話語中。
這個技術可以幫助人工智能在真正理解人類話語的路上跨出一步,盡管該模型在強化學習后偶爾會變得不穩(wěn)定,不過它依舊顯著地提升了話語的多樣性。此外,微軟今年推出了一款可以識別情緒的工具,根據上傳的圖片就可以分析出情緒特征,但同時微軟也聲明目前這款軟件還只是以娛樂為主,還不能每次都能正確的識別情緒。