MetaMind獲800萬美元風(fēng)投資金,使深度學(xué)習(xí)不再神秘
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。作為人工智能的一種,“深度學(xué)習(xí)”是一個(gè)訓(xùn)練系統(tǒng),能處理海量信息,它們來源于音頻、圖像和其他輸入的信號(hào),如果向這個(gè)系統(tǒng)展示新信息,它會(huì)以推論的形式作出反潰像Google和Facebook這樣的科技企業(yè)已經(jīng)在這個(gè)領(lǐng)域取得了技術(shù)進(jìn)步并展開并購,“深度學(xué)習(xí)”的初創(chuàng)公司也在大量涌現(xiàn)。
斯坦福大學(xué)研究生Richard Socher在畢業(yè)之后創(chuàng)建了MetaMind,且于四個(gè)月后便從風(fēng)投巨頭Khosla Venture和Salesforce首席執(zhí)行官M(fèi)arc Benioff獲得 800 萬美元投資。
(MetaMind創(chuàng)始人Richard Socher,和 Sven Strohband在位于加州的辦公室)
Richard Socher從沒想到他會(huì)進(jìn)入人工智能的尖端領(lǐng)域,他只是想把自己喜歡的數(shù)學(xué)和語言結(jié)合起來。
但是事情一件接一件地發(fā)生了,他開發(fā)完成了一項(xiàng)出色的技術(shù)“遞歸神經(jīng)網(wǎng)絡(luò)”(recursive neural networks),現(xiàn)在,他從大學(xué)離職后創(chuàng)辦的企業(yè)MetaMind正式啟動(dòng)了,并獲得了數(shù)家著名企業(yè)的金融支持。
公司成立僅四個(gè)月,Socher和他的團(tuán)隊(duì)力圖證明在“深度學(xué)習(xí)”領(lǐng)域MetaMind處理圖像和文本的能力比目前任何技術(shù)都更卓越。為此,除了宣布從Khosla Venture和Salesforce首席執(zhí)行官M(fèi)arc Benioff那里得到了800萬美元的資金之外,MetaMind還在官網(wǎng)演示了他們的多種技術(shù)能力。
作為人工智能的一種,“深度學(xué)習(xí)”是一個(gè)訓(xùn)練系統(tǒng),能處理海量信息,它們來源于音頻、圖像和其他輸入的信號(hào),如果向這個(gè)系統(tǒng)展示新信息,它會(huì)以推論的形式作出反潰像Google和Facebook這樣的科技企業(yè)已經(jīng)在這個(gè)領(lǐng)域取得了技術(shù)進(jìn)步并展開并購,“深度學(xué)習(xí)”的初創(chuàng)公司也在大量涌現(xiàn)。
但是,Socher認(rèn)為人們?cè)谑褂肕etaMind時(shí)能體會(huì)到它的優(yōu)勢(shì),這家初創(chuàng)公司擁有兩項(xiàng)核心技術(shù),一是受聘于Facebook的紐約大學(xué)教授Yann LeCun研發(fā)的“卷積神經(jīng)網(wǎng)絡(luò)”,該技術(shù)在圖片挖掘方面取得了突破性進(jìn)展;還有就是索赫爾自己的“遞歸神經(jīng)網(wǎng)絡(luò)”,它在文本處理方面成就斐然。
Socher接受科技博客VentureBeat的采訪時(shí)說:“我們處在這項(xiàng)技術(shù)的前沿,并能與其他公開的技術(shù)一較高下,我們想盡量用科學(xué)化的語言來表述它。”
像拖放那樣簡單它就像鼠標(biāo)拖放一樣簡單,這意味著現(xiàn)在幾乎任何人都能進(jìn)行“深度學(xué)習(xí)”。
“你不必是程序員”,正如Socher演示的那樣,用戶可以給MetaMind一些簡單的文本來進(jìn)行訓(xùn)練,然后會(huì)收到若干行代碼,它們可以直接嵌入應(yīng)用程序,不需建立數(shù)據(jù)中心,甚至用像“亞馬遜網(wǎng)絡(luò)服務(wù)”這樣的公共云,所有的一切MetaMind全能搞定。
MetaMind網(wǎng)站上還有很多這樣的演示,有的可以指出兩個(gè)句子在語義上是多么相近,有的能就用戶搜索的某一主題詞顯示推文的肯定或否定程度。MetaMind還可以形成一個(gè)分類器:用戶上傳一個(gè)帶有文本標(biāo)簽的電子表格,使系統(tǒng)知道要搜索什么,然后再給它一些文本,讓它進(jìn)行動(dòng)態(tài)分析。
只要用一組相關(guān)圖片進(jìn)行訓(xùn)練,MetaMind還能對(duì)圖像進(jìn)行分類。當(dāng)它“消化”了一些食物圖片之后,你可以拖拽一盤魚或者薯片的照片,它可以很自信地說出圖片里是魚或者薯片。
Socher還演示了MetaMind如何提取與文本框中輸入的文字相匹配的圖像。
或是輸入幾個(gè)詞Socher用筆記本電腦輸入了“鳥”(bird)這個(gè)詞,系統(tǒng)展示了一些圖像,每張都有一只鳥。然后他輸入了鳥的復(fù)數(shù)形式(birds),圖像發(fā)生了變化,每張上都有很多只鳥。他說:“最酷的是它真的具有語義合成的感覺——詞匯如何組成了較長語句的意義。”他鍵入“水上的鳥”,然后系統(tǒng)給出了鳥在水上飛翔的圖片。
這種工作要求多種類型的“深度學(xué)習(xí)”,“卷積神經(jīng)網(wǎng)絡(luò)”在掃描大量圖像之后能夠提取特征,而“遞歸神經(jīng)網(wǎng)絡(luò)”能從句子中提取意義,這兩項(xiàng)技術(shù)可以協(xié)同工作。Google和微軟最近分別宣布他們已經(jīng)掌握了一次性處理文字和圖像的技術(shù),但是Socher去年獨(dú)立完成了這項(xiàng)研究,并在今年2月發(fā)表了兩篇論文。他說:“我們擁有這項(xiàng)技術(shù)已經(jīng)有幾個(gè)月了。”
Socher走過了一條漫長的道路,他是德國人,大學(xué)期間他研究自然語言處理(NLP),但是他覺得其中數(shù)學(xué)的成分太少了,因此研究生階段他開始研究計(jì)算機(jī)視覺,雖然數(shù)學(xué)的成分多了,但是仍不完美,因?yàn)槟翘唵瘟?。隨后他去美國讀博士,在斯坦福大學(xué)專攻機(jī)器學(xué)習(xí)。在那里他聽了Andrew Ng教授關(guān)于“深度學(xué)習(xí)”及其在計(jì)算機(jī)視覺中的應(yīng)用的報(bào)告。
“我覺得那是非常棒的想法,但是它們?nèi)匀徊惶m合自然語言處理,”索赫爾說,“我創(chuàng)造了一些‘深度學(xué)習(xí)’的新模式,可以應(yīng)用于自然語言的處理。”
他的“遞歸神經(jīng)網(wǎng)絡(luò)”分析相鄰兩個(gè)詞之間的關(guān)聯(lián),然后它再分析這兩個(gè)詞和它們左邊那個(gè)詞的聯(lián)系,以此類推,“遞歸”這個(gè)詞的意思就是直到它能理解一句話中所有的語言成分的意義。
2011年他首次提出了這些模型,在學(xué)術(shù)界引發(fā)了興趣,之后他發(fā)表了數(shù)篇論文來證明“遞歸神經(jīng)網(wǎng)絡(luò)”的可行性。
他曾想從事研究工作,但是今年初,他意識(shí)到他不想走這條路。
作為斯坦福大學(xué)“機(jī)器學(xué)習(xí)”課程300多名學(xué)生的助教,Socher看到大家很想把這種技術(shù)應(yīng)用于所有的數(shù)據(jù)類型。
“每五分鐘就有一個(gè)完全不同領(lǐng)域的新項(xiàng)目,”他說,“我喜歡這樣,機(jī)器學(xué)習(xí)前景廣闊,而且它的重要性將進(jìn)一步顯現(xiàn)。”
幾年來,他拒絕了大公司提供的工作邀請(qǐng),他想把這些技術(shù)帶入更廣闊的領(lǐng)域,讓更多的個(gè)人和企業(yè)能夠使用。
創(chuàng)立企業(yè)他需要資金建立團(tuán)隊(duì)來實(shí)現(xiàn)這些想法,最后他去了Khosla風(fēng)投,見到了這家公司的首席技術(shù)官Sven Strohband?,F(xiàn)在,Strohband已經(jīng)加入MetaMind擔(dān)任首席執(zhí)行官。
同時(shí),Khosla風(fēng)投的創(chuàng)始人Vinod Khosla(也是Sun Microsystems的聯(lián)合創(chuàng)始人)擔(dān)任這家初創(chuàng)公司的顧問,Salesforce網(wǎng)的首席執(zhí)行官貝尼奧夫和蒙特利爾大學(xué)該領(lǐng)域領(lǐng)軍人物Yoshua Bengio都加入了公司高層。
MetaMind已經(jīng)建立了一個(gè)10人團(tuán)隊(duì),并且開始吸引付費(fèi)用戶,他們?yōu)樾∑髽I(yè)提供服務(wù),也為財(cái)富500強(qiáng)的大企業(yè)工作。他們?yōu)樵谄髽I(yè)數(shù)據(jù)中心運(yùn)行的MetaMind系統(tǒng)發(fā)放許可證,還可以為使用MetaMind動(dòng)力系統(tǒng)的公司提供額外的咨詢服務(wù)。
具體業(yè)務(wù)包括抽取財(cái)務(wù)分析報(bào)告中隱藏的關(guān)鍵詞,或分析人們尋求客服幫助的聊天記錄。更豐富的應(yīng)用還有根據(jù)X光片預(yù)測病情等。
雖然MetaMind已經(jīng)有很多此類應(yīng)用,但是他們還在征集新的項(xiàng)目,顯示出開放的心態(tài),目的是想讓世界告訴他們什么才是最好的選擇,這對(duì)一個(gè)初創(chuàng)公司來說是非常正確的。
Strohband說:“我們相信它應(yīng)該為更多人所用,因?yàn)槲覀冋J(rèn)為它有很多用途,坦率的說我們真的無法預(yù)料人們會(huì)用它還干什么。”