微軟機(jī)器學(xué)習(xí)的發(fā)展從測謊儀開始
最近,微軟的Jennnifer Marsman 在他自己的老板身上測試了一下自己設(shè)計(jì)的測謊儀。
“你覺得你所在的公司是全世界最好的公司嗎?”
“當(dāng)然”
“哈!根據(jù)測謊儀的反應(yīng),這話有點(diǎn)心虛。”
“今年會提拔我嗎?”
“當(dāng)然”
“這話聽起來倒不假。”
不過,微軟可不是在玩執(zhí)法游戲。37 歲的Marsman是個“重量級技術(shù)布道者”(principal developer evangelist),她的工作就是不遺余力地推廣機(jī)器學(xué)習(xí)——人工智能的一種形式,利用數(shù)據(jù)預(yù)測所有事,從季度銷量到奶牛什么時候懷孕等等。(譯者注:技術(shù)布道師是最前線也是最重要的“翻譯者”,他們能夠把技術(shù)以易懂的方式解釋給來自不同領(lǐng)域的人,以此獲得他們對產(chǎn)品或技術(shù)的支持。這需要又懂技術(shù)又能挖掘出技術(shù)背后故事的人才,他們能夠激發(fā)起人們對于一個產(chǎn)品的激情。)
Marsman 設(shè)計(jì)的測謊儀將算法和 14 個分列排布的用來監(jiān)測腦電腦的頭戴式設(shè)備結(jié)合起來一起工作,這就像是聚會上的一個小把戲。Marsman 借此向軟件開發(fā)者展示如何使用微軟 Azure 機(jī)器學(xué)習(xí)(Azure Machine Learning)工具。Marsman 在微軟扮演著重要角色,微軟在機(jī)器學(xué)習(xí)領(lǐng)域起步早,但是現(xiàn)在面臨著來自Google 和亞馬遜機(jī)器學(xué)習(xí)商業(yè)化的競爭。
這樣的風(fēng)險相當(dāng)高。接下來的幾年,機(jī)器學(xué)習(xí)將會改變世界——會使得計(jì)算機(jī)智能程度呈指數(shù)級增長,并幫助削減公司成本,預(yù)測哪些值得投資,哪些值得大筆投資。彭博社智庫(Bloomberg Intelligence)分析員 Anurag Rana 稱這項(xiàng)技術(shù)“是區(qū)分軟件公司發(fā)展好壞的最重要因素。”離開機(jī)器學(xué)習(xí),他說:“你都無法賣出產(chǎn)品。”
雖然微軟已經(jīng)在機(jī)器學(xué)習(xí)領(lǐng)域耕耘了至少 20 年,但是 Office 和 Windows 這類部門一度小心謹(jǐn)慎地利用其預(yù)測功能。“很多人的反應(yīng)就是‘我們知道怎么去做,為什么你還要用數(shù)據(jù)質(zhì)疑我的觀點(diǎn)?’”華盛頓大學(xué)計(jì)算機(jī)科學(xué)教授 Pedro Domingos 如此表述,他寫了一本關(guān)于機(jī)器學(xué)習(xí)的書——《算法大師》(The Master Algorithm)。
當(dāng)微軟嘗試用 Bing 搜索趕超 Google 的時候,微軟才真正擁抱機(jī)器學(xué)習(xí)技術(shù)。兩年前,Satya Nadella擔(dān)任微軟 CEO,在此之前,他就為搜索部門定下了工程和技術(shù)戰(zhàn)略,并把機(jī)器學(xué)習(xí)技術(shù)向魔法粉一樣灑落在公司涉及的所有產(chǎn)品中。“機(jī)器學(xué)習(xí)深深嵌入了微軟公司,微軟現(xiàn)在處于這樣的位置,”Domingos 說。“他們正大力投資機(jī)器學(xué)習(xí),以使得該領(lǐng)域不那么荒蕪。”
與 Google 和蘋果使用機(jī)器學(xué)習(xí)改善自家產(chǎn)品一樣,微軟將這項(xiàng)技術(shù)融入到自身的運(yùn)營中。這不僅僅是節(jié)省成本,幫助公司更好運(yùn)作;微軟自身使用這技術(shù)越多,向客戶解釋和銷售就更容易。“客戶很困惑,”Joseph Sirosh 說,2013 年,微軟把他從亞馬遜挖來,負(fù)責(zé)微軟機(jī)器學(xué)習(xí)工程。“在一片不解聲中前行頗具挑戰(zhàn)。同時,內(nèi)部也困難重重,銷售人員要說服消費(fèi)者并向他們講解所有的使用場景。”
微軟首席財務(wù)官 Amy Hood 的財務(wù)部門已經(jīng)開始依賴算法——使用算法預(yù)測銷售數(shù)據(jù),預(yù)測在給定時間段內(nèi)的授權(quán)數(shù)量。“結(jié)果表明非常非常精準(zhǔn),”Sirosh 說,“Amy Hood 是機(jī)器學(xué)習(xí)的超級粉絲,知道機(jī)器學(xué)習(xí)模型預(yù)測地季度數(shù)據(jù)后,她也能睡個好覺。”
微軟還用算法預(yù)測隨著數(shù)據(jù)中心的快速擴(kuò)張,還需要采購多少服務(wù)器,并幫助銷售人員確定重點(diǎn)客戶。Sirosh表示,甚至之前的老產(chǎn)品,如 2002 年收購的一款財會軟件都得到了機(jī)器學(xué)習(xí)的加持。微軟的 Cotrana 分析套件(Cotrana AnalyTIcs Suite)可以讓用戶自己動手打造這樣一類工具。
25 歲的Ram Shankar Siva Kumar自稱自己是數(shù)據(jù)牛仔(data cowboy),是 Azure 安全數(shù)據(jù)科學(xué)(Azure Security Data Science)團(tuán)隊(duì)的一員。他使用機(jī)器學(xué)習(xí)算法來預(yù)測微軟網(wǎng)絡(luò)中的可疑行為。一旦知曉需要尋找的目標(biāo),微軟的安全團(tuán)隊(duì)能很快找到攻擊源,而 Kumar 必須在任何人知道這一情況之前找到他們。
為了訓(xùn)練算法識別有害行為的能力,他有償鼓勵微軟紅色團(tuán)隊(duì)(Microsoft’s Red Team)的黑客去攻擊網(wǎng)絡(luò)以及來自微軟安全中心的危險報告,用實(shí)際的攻擊去訓(xùn)練算法。這能幫助他建立模型以識別真正的漏洞。
各行各業(yè)正在使用微軟的技術(shù)。日本農(nóng)民用技術(shù)追蹤奶牛,奶牛準(zhǔn)備受孕時走動會更頻繁,所以他們能讓奶牛在最佳的時間受孕。一家澳大利亞的酒廠也使用類似的算法預(yù)測葡萄產(chǎn)量。一家距離微軟大約 1 小時車程的醫(yī)院使用 Azure 工具找出哪些心臟病患者更有可能需要再住院檢查。挪威 eSmart 系統(tǒng)利用 Azure 機(jī)器學(xué)習(xí)預(yù)測能源網(wǎng)使用量,并在需求高的時候關(guān)閉家用供暖。
Matt McIlwain 是西雅圖 Madrona 風(fēng)險投資集團(tuán)(Madrona Venture Group)總經(jīng)理,他認(rèn)為微軟的機(jī)器學(xué)習(xí)技術(shù)不比競爭對手的技術(shù)差,甚至更好。但是他也認(rèn)為微軟仍然缺乏品牌感知,目前正在迎頭趕上。“人們?nèi)绾伟l(fā)現(xiàn)微軟真的有很棒的機(jī)器學(xué)習(xí)技術(shù)?”他說。“微軟必須將自己推銷出去。”
這正是 Jennifer Marsman 的切入點(diǎn)。她遍歷全球,展示她的測謊儀并大力宣傳機(jī)器學(xué)習(xí)的潛在用途。其中醫(yī)療應(yīng)用討論頗多。人們已經(jīng)問到使用該技術(shù)預(yù)測癲癇、監(jiān)控依賴輔助生活設(shè)施的老人并決定在比賽中受傷的運(yùn)動員是直接去醫(yī)院還是回到場上繼續(xù)比賽。“我在公司有著最酷的工作。”