人工智能已成社會(huì)的一部分 但目前量化人工智能的價(jià)值還有困難
掃描二維碼
隨時(shí)隨地手機(jī)看文章
2019 年無(wú)疑是忙碌的一年。人工智能的進(jìn)步和新聞?lì)l頻登上頭條新聞,讓我們的生活充滿了敬畏和自豪的時(shí)刻,但一些其他時(shí)刻充卻斥著一種惱人的想法,那就是這項(xiàng)技術(shù)讓人們發(fā)現(xiàn),我們的社會(huì)并沒(méi)有準(zhǔn)備好迎接人工智能的普及。
2019 年,究竟是人工智能進(jìn)步的一年,還是幻滅的一年呢?隨著研究人員攻城略地,迅速攻克以前難以企及的基準(zhǔn),今天,我們可不可以這樣認(rèn)為,這個(gè)領(lǐng)域已經(jīng)正在步入穩(wěn)步發(fā)展的軌道呢?
在 ADSP(Applied Data Science Partners,意即“應(yīng)用數(shù)據(jù)科學(xué)合作伙伴”)網(wǎng)站上,我們想后退一步,把 2019 年的人工智能界發(fā)生的事件整理好,以讓公眾能夠有個(gè)全新的視角。在聚光燈下,重要的是要將一項(xiàng)工作最初吸引人們的興趣,與它的實(shí)際重要性,以及它對(duì)該領(lǐng)域產(chǎn)生的影響區(qū)分開(kāi)來(lái)。為此,本文將展開(kāi)人工智能故事的平行線索,并試圖分離出它們的意義。多虧了我們出色的內(nèi)容作家 Elena Nisioti,她將這些故事講得如此精彩!
讓我們坐下來(lái),一起回顧 2019 年的人工智能領(lǐng)域的方方面面。
處在文藝復(fù)興時(shí)期的領(lǐng)域
如果讓我們用一句話來(lái)描述 2019 年的人工智能現(xiàn)狀,那很可能是:“強(qiáng)化學(xué)習(xí)(Reinforcement Learning )回歸,看起來(lái)將永存”。
到目前為止,我們中的大多數(shù)人可能已經(jīng)熟悉了 監(jiān)督式學(xué)習(xí)(Supervised Learning):有些人收集了大量的 訓(xùn)練數(shù)據(jù),將它們饋送到 機(jī)器學(xué)習(xí)算法 中,然后得到一個(gè) 模型,這個(gè)模型可以為我們進(jìn)行 預(yù)測(cè) 和 分類(lèi)。我們中的一些人甚至可能有這樣的印象:即,人工智能就是監(jiān)督式學(xué)習(xí)的同義詞。然而,監(jiān)督式學(xué)習(xí)只不過(guò)是我們今天擁有的 眾多類(lèi)型的機(jī)器學(xué)習(xí) 中的一種罷了。
在強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)中,智能體用 試錯(cuò) 的方法,通過(guò)與環(huán)境進(jìn)行交互來(lái)學(xué)習(xí),這種環(huán)境會(huì)給它們的 行為 提供 獎(jiǎng)勵(lì)回報(bào)。當(dāng)涉及到多個(gè)智能體時(shí),它們被稱(chēng)為 多智能體強(qiáng)化學(xué)習(xí)系統(tǒng)(Multi-agent Reinforcement Learning System)。
這個(gè)領(lǐng)域已經(jīng)存在幾十年,從概念上來(lái)講,它聽(tīng)起來(lái)比監(jiān)督式學(xué)習(xí)更像是一種合理的創(chuàng)造智能的學(xué)習(xí)機(jī)制。然而,直到 2015 年,DeepMind 才獲得了人們的關(guān)注,當(dāng)時(shí) DeepMind 使用深度 Q 學(xué)習(xí)(Deep Q-learning)創(chuàng)建了 Atari(雅達(dá)利) 游戲的智能體,這是一種結(jié)合了經(jīng)典強(qiáng)化學(xué)習(xí)算法和深度神經(jīng)網(wǎng)絡(luò)的算法。2018 年,OpenAI 也通過(guò) 解決 Montezuma’s Revenge(一款被認(rèn)為難度特別高的 Atari 游戲),從而在這一領(lǐng)域確立了自己的地位。
在過(guò)去的幾個(gè)月里,事態(tài)升級(jí)了:
這些工作重新喚起了學(xué)術(shù)界對(duì)強(qiáng)化學(xué)習(xí)的信念,在過(guò)去,人們?cè)?jīng)認(rèn)為強(qiáng)化學(xué)習(xí)效率低下,過(guò)于簡(jiǎn)單,無(wú)法解決復(fù)雜的問(wèn)題,甚至連游戲的問(wèn)題也不能解決。
今年,另一個(gè)大受歡迎的應(yīng)用是 自然語(yǔ)言處理(Natural Language Processing,NLP)。盡管研究人員在這一領(lǐng)域工作了幾十年,但近些年的自然語(yǔ)言處理系統(tǒng)生成的文本聽(tīng)起來(lái)還是不夠自然。自 2018 年底以來(lái),人們的注意力已經(jīng)從過(guò)去的詞嵌入轉(zhuǎn)移到 預(yù)訓(xùn)練語(yǔ)言模型,這是自然語(yǔ)言處理從計(jì)算機(jī)視覺(jué)中借鑒來(lái)的一種技術(shù)。這些模型的訓(xùn)練是以非監(jiān)督的方式進(jìn)行的,這使得現(xiàn)代系統(tǒng)能夠從互聯(lián)網(wǎng)上的大量文本中進(jìn)行學(xué)習(xí)。因此,這些模型變得“博聞強(qiáng)識(shí)”,并發(fā)展出了理解上下文的能力。然后,可以通過(guò)監(jiān)督式學(xué)習(xí)進(jìn)一步提高它們?cè)谔囟ㄈ蝿?wù)上的表現(xiàn)。這種通過(guò)在不同任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)模型來(lái)改進(jìn)模型的做法,屬于 遷移學(xué)習(xí)(transfer learning)的范疇,被認(rèn)為具有巨大的潛力。
自去年 Google BERT、ELMo 和 ulmfit 等系統(tǒng)在 2018 年底推出以來(lái),自然語(yǔ)言處理一直風(fēng)頭正茂,但今年的聚光燈被 OpenAI 的 GPT-2 給“奪走了”,它的表現(xiàn)引發(fā)了人們對(duì) 自然語(yǔ)言處理系統(tǒng)的道德使用的大討論。
實(shí)踐走向成熟
今年,人們也見(jiàn)證了最近一些深度學(xué)習(xí)技術(shù)走向成熟。應(yīng)用監(jiān)督式學(xué)習(xí),特別是 計(jì)算機(jī)視覺(jué) 技術(shù),已經(jīng)催生了現(xiàn)實(shí)生活中成功的產(chǎn)品和系統(tǒng)。
生成對(duì)抗網(wǎng)絡(luò)(GeneraTIve Adversarial Networks,GAN)是一對(duì)神經(jīng)網(wǎng)絡(luò),其中,生成器網(wǎng)絡(luò)試圖通過(guò)學(xué)習(xí)生成模仿訓(xùn)練數(shù)據(jù)的圖像來(lái)欺騙判別器網(wǎng)絡(luò),現(xiàn)在已經(jīng)達(dá)到了近乎完美的水平。對(duì)人工智能來(lái)說(shuō),創(chuàng)造虛假但又逼真的人物和物體的圖像,已經(jīng)不再是前沿領(lǐng)域了。從 2014 年生成對(duì)抗網(wǎng)絡(luò)的引入 到 2019 年 NVDIA 開(kāi)源的 StyleGAN,一圖勝千言,我們用下面的圖片來(lái)說(shuō)明,這可能是理解該領(lǐng)域進(jìn)展情況的最佳方式:
2019 年,人工智能創(chuàng)造的藝術(shù)品甚至脫離了過(guò)去幾年的假設(shè)性討論,成為了今天 博物館裝置和拍賣(mài) 的一部分。
計(jì)算機(jī)視覺(jué)還被應(yīng)用于一些具有重大商業(yè)和社會(huì)意義的領(lǐng)域,包括自動(dòng)駕駛車(chē)輛和醫(yī)學(xué)。但是,人工智能算法在這些領(lǐng)域中的應(yīng)用自然是緩慢的,因?yàn)樗鼈冎苯优c人類(lèi)生活直接互動(dòng)。至少到目前為止,這些系統(tǒng)還 不是完全自主的,它們的目的,在于支持和 增強(qiáng) 人類(lèi)操作員的能力。
研究團(tuán)隊(duì)正與醫(yī)院密切合作,開(kāi)發(fā)用于疾病早期預(yù)測(cè)的人工智能系統(tǒng),并整理大量的健康數(shù)據(jù)檔案,其中一個(gè)值得注意的例子,是 DeepMind Health 和 UCLH 之間正在進(jìn)行的合作。然而,這些工作中的大部分仍處于試驗(yàn)階段,迄今為止,唯一獲得 FDA 批準(zhǔn)的人工智能系統(tǒng)是 SubtlePet,這是一款使用深度學(xué)習(xí)增強(qiáng)醫(yī)學(xué)圖像的軟件。
沉睡的巨人
AutoML 是機(jī)器學(xué)習(xí)的子領(lǐng)域之一,自 20 世紀(jì) 90 年代以來(lái)就一直存在,在 2016 年引起了人們的極大興趣,但不知何故從未登上頭條新聞,至少不像其他人工智能趨勢(shì)那樣。也許這是因?yàn)樗⒉荒敲椿ㄉ诘男再|(zhì):AutoML 的目的是通過(guò)自動(dòng)化決策來(lái)使機(jī)器學(xué)習(xí)的實(shí)踐更有效,而今天數(shù)據(jù)科學(xué)家是通過(guò)手動(dòng)、蠻力調(diào)優(yōu)做出的決策。
在過(guò)去三年中,我們對(duì)這一領(lǐng)域的理解已經(jīng)發(fā)生了變化,今天,大多數(shù)大公司都提供了 AutoML 工具,包括 Google Cloud AutoML、Microsoft Azure、Amazon Web Service 和 DataRobot 等。今年,隨著 學(xué)習(xí)進(jìn)化人工智能框架(Learning EvoluTIonary AI Framework,LEAF)成為最先進(jìn)的人工智能技術(shù),人們的興趣轉(zhuǎn)向了“進(jìn)化”(EvoluTIonary)方法。然而,AutoML 還沒(méi)有達(dá)到可以讓一個(gè)完全自動(dòng)化的人工智能系統(tǒng)比人工智能專(zhuān)家團(tuán)隊(duì)執(zhí)行更好的成熟水平。
2019年AI人工智能領(lǐng)域都發(fā)生了什么?
對(duì)人工智能的擔(dān)憂
盡管取得了壓倒性的成功,但今年人工智能領(lǐng)域也給我們帶來(lái)了一些令人沮喪的故事。其中主要問(wèn)題之一是 機(jī)器學(xué)習(xí)模型中的偏見(jiàn),這一問(wèn)題直到 2018 年才顯現(xiàn)出來(lái),當(dāng)時(shí) Amazon 發(fā)現(xiàn)他們的 自動(dòng)招聘系統(tǒng)中存在性別偏見(jiàn),而美國(guó)法院廣泛使用的判決工具 COMPAS 也被發(fā)現(xiàn)存在性別和種族的偏見(jiàn)。
今年案件的數(shù)量有所增加,這可能表明,公眾和機(jī)構(gòu)對(duì)用于自動(dòng)化決策的現(xiàn)有人工智能系統(tǒng)越來(lái)越懷疑。以下是圖景的一小部分:
今年 10 月份,某醫(yī)院的算法被發(fā)現(xiàn)對(duì)黑種人患者存有偏見(jiàn)。
去年 10 月,某人權(quán)組織指責(zé)用于發(fā)放英國(guó)簽證的人工智能系統(tǒng)存在種族偏見(jiàn)。
今年 11 月,Apple 的信用評(píng)分系統(tǒng)被客戶指責(zé)存有性別偏見(jiàn)。
偏見(jiàn)是一個(gè)特別令人擔(dān)憂的問(wèn)題,因?yàn)樗挥诒O(jiān)督式深度學(xué)習(xí)的核心中:當(dāng)有偏見(jiàn)的數(shù)據(jù)被用于訓(xùn)練,且預(yù)測(cè)模型無(wú)法 解釋 時(shí),我們不能真正判斷出是否存有偏見(jiàn)。迄今為止,學(xué)術(shù)界的反應(yīng)一直是致力于開(kāi)發(fā)技術(shù),以了解深度模型決策背后的原因,但專(zhuān)家警告稱(chēng),如果我們采用正確的實(shí)踐方法,那么許多問(wèn)題都可以迎刃而解。Google Cloud Model Cards 是最近的一次嘗試,旨在使組織社區(qū)走向開(kāi)源模式,同時(shí)明確描述其性質(zhì)和局限性。
今年另一個(gè)讓人擔(dān)憂的發(fā)現(xiàn)是,當(dāng)一項(xiàng)技術(shù)變得越復(fù)雜時(shí),它被濫用的可能性就越大。Deepfake 就是生成對(duì)抗網(wǎng)絡(luò)的陰暗面,深度學(xué)習(xí)算法被用來(lái)在純粹虛構(gòu)的場(chǎng)景中創(chuàng)建涉及真實(shí)人物的圖片或視頻。人們不難看出,這項(xiàng)技術(shù)如何被用于傳播虛假新聞,從政治宣傳到欺凌。這個(gè)問(wèn)題單靠科學(xué)家是無(wú)法解決的,歷史已經(jīng)證明,科學(xué)家并不善于預(yù)測(cè)他們的發(fā)現(xiàn)對(duì)現(xiàn)實(shí)生活的影響,更不用說(shuō)控制它們了,這需要社會(huì)各界進(jìn)行廣泛的對(duì)話。
今天的人工智能有多強(qiáng)大?
如今,要量化人工智能的價(jià)值真的很困難。但有一點(diǎn)是可以肯定的:人工智能已經(jīng)脫離了科幻小說(shuō)和前衛(wèi)計(jì)算機(jī)科學(xué)的領(lǐng)域,現(xiàn)在,人工智能已成為社會(huì)不可分割的一部分,人們對(duì)人工智能進(jìn)行了大量的投資。
今年早些時(shí)候,三名主要的深度學(xué)習(xí)研究人員獲得了圖靈獎(jiǎng),這是對(duì)人工智能作為計(jì)算機(jī)科學(xué)的一個(gè)領(lǐng)域的認(rèn)可,而人們對(duì)此期待已久。