微軟前副總裁:機器學(xué)習和人工智能5大關(guān)鍵
微軟前副總裁S. Somasegar從智能應(yīng)用開發(fā)的角度,總結(jié)了2016機器學(xué)習和人工智能的5大發(fā)展趨勢:算法和數(shù)據(jù)結(jié)合的微智能,將能靈活地在應(yīng)用中得到融合;讓“每一個應(yīng)用都變得智能”;人工智能的黑箱將被揭開;現(xiàn)階段的機器學(xué)習和人工智能中,人類的作用不可替代;最后,他認為對于企業(yè)來說,不是從一開始就需要機器學(xué)習。
風險投資集團Madrona不久前在西雅圖舉辦了一場機器學(xué)習與人工智能峰會,匯集了智能應(yīng)用生態(tài)系統(tǒng)中不少大公司和初創(chuàng)企業(yè)。
本次峰會的一個重要的議題來自對與會者的問卷調(diào)查。在調(diào)查中,所有受訪者都表示,機器學(xué)習對他們的公司和所在行業(yè)很重要或者非常重要。
然而,超過半數(shù)的受訪者認為,自己所在的機構(gòu)在機器學(xué)習上還不夠?qū)I(yè),難以支持他們完成需要做的事。
S. Somasegar
微軟開發(fā)者部門前任副總裁,現(xiàn)Madrona投資合伙人S. Somasegar參加了這次峰會,下文是他所寫的總結(jié)。他認為,本次峰會展現(xiàn)了機器學(xué)習和人工智能當下的五個趨勢:
1. 微智能(micro-intelligence)和中間件(middle-ware)服務(wù)
廣義上講,現(xiàn)在的公司分為兩類:一類是研發(fā)機器學(xué)習和人工智能技術(shù)的;另一類則是在應(yīng)用和服務(wù)中使用機器學(xué)習和人工智能的。在包括數(shù)據(jù)預(yù)服務(wù)和學(xué)習服務(wù)或Maas提供者的(數(shù)據(jù)存儲)塊服務(wù)(比如aka和中間件服務(wù))中,現(xiàn)在正有大量的革新在發(fā)生。
隨著微服務(wù)(microservices)的出現(xiàn),并且通過REST API 可以完美地連接這些微服務(wù),現(xiàn)在有一種逐漸增強的趨勢,即,讓學(xué)習服務(wù)和機器學(xué)習算法能夠得到使用和再使用,而不是像以前那樣必須從頭開始重新設(shè)計。
舉個例子,Algorithmia 公司提供了一個算法交易平臺,任何智能的應(yīng)用都能按需取用平臺上的算法。這些算法和模型與特定數(shù)據(jù)集的結(jié)合(使用條件限于特殊的verTIcal),就是我們所說的微智能。這些微智能可以完美地融入應(yīng)用中。
2.每一個應(yīng)用都會變得智能
如果你的公司還沒開始使用機器學(xué)習來監(jiān)測異常,推薦產(chǎn)品或者預(yù)測客戶流失,你很快就會用到了。由于新數(shù)據(jù)的快速迭代、大量計算能力變得可用以及新的機器學(xué)習平臺門檻降低(不管是在大型的科技公司,比如亞馬遜、谷歌和微軟,或者初創(chuàng)企業(yè)),我們會看到越來越多的應(yīng)用,它們能夠產(chǎn)生實時的預(yù)測,并且不斷變得更好。在過去六個月,我們所見到的所有100多個處于早期的初創(chuàng)企業(yè)中,超過90%都在計劃使用機器學(xué)習來提供更好的用戶體驗。
谷歌使用AI技術(shù)的軟件數(shù)量近年來大幅增加
3.黑箱不黑
在機器學(xué)習和人工智能的世界中,信任和透明絕對是至關(guān)重要的。
過去的一年間,有好幾個高調(diào)的機器學(xué)習和人工智能項目走到了聚光燈下,包括微軟的Tay,谷歌DeepMind 的AlphaGo,F(xiàn)acebook的聊天應(yīng)用 M 以及各種各樣的聊天機器人。自然用戶交互界面的發(fā)展(聲音,對話和視覺)為我們提供了非常有意思的選擇和機會,讓人類可以與虛擬助手(蘋果的Siri,亞馬遜的Alexa,微軟的Cortana以及Viv)互動。
在我們與人工智能產(chǎn)品的交互中,也有一些令人煩惱的例子。比如,在Georgia Tech的一門線上課程結(jié)束時,學(xué)生們才發(fā)現(xiàn)一位與他們互動了一整個學(xué)期的助教Jill竟然是聊天機器人。
這一例子展現(xiàn)了技術(shù)和創(chuàng)新的神奇之處,同時,也引發(fā)了一些關(guān)于機器人、機器學(xué)習和人工智能的世界中信任和透明這方面規(guī)則的思考。
與人工智能相關(guān)的工作中,理解“是什么”背后的“為什么”通常是另一個比較關(guān)鍵的部分。對于醫(yī)生和病人來說,只告訴他們“有75%的概率觸發(fā)癌癥,需要使用某種藥物進行治療”,這還不夠,他們需要知道是什么信息讓機器得到了這一預(yù)測或者答案。
我們百分之百地相信,對于機器學(xué)習,接下來我們可以做到完全透明,我們還應(yīng)該想清楚,這一技術(shù)的進步在道德上會有什么啟發(fā),這會是我們生活中不可缺少的一部分,也是社會進步不可缺少的一部分。
4.人類依然不可或缺
關(guān)于我們該不該擔心人工智能會代替人類,接管世界這一話題,現(xiàn)在有許多討論。在自動化領(lǐng)域,機器學(xué)習和人工智能發(fā)揮著重要作用,并且獲得了巨大的進步。但是,可以肯定的是,在智能應(yīng)用的開發(fā)中,我們?nèi)匀恍枰祟?,來?chuàng)造正確的,端對端的用戶體驗。
房屋買賣網(wǎng)站Redfin做了一個嘗試,把機器學(xué)習生成的推薦推送給用戶。這些機器生成的推薦比起用戶自行搜索和篩選的結(jié)果更能吸引用戶。不過,匹配率真正大幅度地提升是在Redfin讓中介對機器生成的推薦進行修正后再推送。Redfin能夠把中介對機器的推薦的修正作為額外的訓(xùn)練數(shù)據(jù),進而帶動推薦房源點擊量的大幅提升。
大數(shù)據(jù)平臺Splunk 也強調(diào)了這一點。如果僅靠機器,沒有人的參與,消費者很難從Splunk獲得最大的價值。
Spare5是一家搜集數(shù)據(jù),以支持計算機視覺研究的公司,他們的例子也說明了人類在訓(xùn)練機器學(xué)習模型中的作用:人類可以對要輸入模型中的數(shù)據(jù)進行修正和分類。
機器學(xué)習中另一個常見的格言是: garbage in, garbage out(輸入的是垃圾,輸出的也是垃圾)。也就是說,數(shù)據(jù)的質(zhì)量和完整性對于建造高效的模型至關(guān)重要。
5.也不是從一開始就需要機器學(xué)習
在智能應(yīng)用的開發(fā)中,機器學(xué)習是一個不可或缺的部分,也是至關(guān)重要的原料,但是,在智能應(yīng)用的開發(fā)中,最關(guān)鍵的目標是建立能夠與你的用戶產(chǎn)生共鳴的應(yīng)用和服務(wù),創(chuàng)造一種簡單的方法,讓消費者可以使用你的服務(wù),并且不斷做得更好。
要有效地使用機器學(xué)習和人工智能,最基本的要求是擁有大型的數(shù)據(jù)集。這一領(lǐng)域的成功人士的建議是:立即開始開發(fā)程序,把自己想要提供的東西拿來試驗,實驗的過程中,思考機器學(xué)習可以如何改進你的應(yīng)用,你需要搜集什么數(shù)據(jù)?來為客戶創(chuàng)造最佳的體驗。
在讓每一個應(yīng)用都變得智能的道路上,我們已經(jīng)走了很遠,但是要做的還很多。正如艾倫人工智能研究院(Allen InsTItute for AI)的CEO Oren Etzioni所說,在人工智能和機器學(xué)習上,我們獲得了長足的進步,但是如果現(xiàn)在就宣布勝利,就好像“剛爬上樹頭便宣稱登上了月球”一樣。