這家公司的人工智能做成這樣,大寫加粗的服!
軟銀投資了一家叫 ObEN 的人工智能公司,其實(shí)是它旗下 SB Next Media 創(chuàng)新基金投出的第一筆錢。這個(gè)基金成立于 2016 年 12 月,主要投資可應(yīng)用于商業(yè)的內(nèi)容、媒體平臺或技術(shù),包括虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)。
軟銀的基金處女投就給了這么一家 “年紀(jì)輕輕” 的公司,真的很是好奇原因啊!
對此,軟銀韓國合伙人及創(chuàng)新基金董事總經(jīng)理 J.PLee 解釋了一下:
我們在尋找 VR/AR 公司時(shí),看到了 ObEN,讓我們興奮的是,他們的應(yīng)用引入了人工智能。同時(shí),他們一流的演講,一流的計(jì)算機(jī)視覺和自然語言處理技術(shù),以及優(yōu)秀的團(tuán)隊(duì)都在致力于為消費(fèi)者創(chuàng)造個(gè)人 AI。
對于這家公司的融資情況:
2014 年 7 月,獲得第一筆種子輪融資;
2016 年 7 月,加入 HTC Vive X 孵化計(jì)劃;
2016 年 11 月,獲得 770 萬美元 A 輪融資;
2017 年 3 月,獲軟銀韓國的投資。
可以看出,ObEN 的發(fā)展比較穩(wěn)健。
那么,這家公司到底做了什么,能讓軟銀出手呢?
簡單來說,ObEN 可以讓你用一張自拍照幾秒鐘構(gòu)建你的 3D 頭像。
只要用手機(jī)拍下正面一張自拍照片,就能兩秒鐘內(nèi)生成一個(gè)完整的 3D VR 頭像化身(照片角度越多,重建效果越精確)。
這個(gè) 3D 頭像化身還擁有完整表情支撐,讓你的 3D VR 頭像擁有七情六欲,喜怒哀樂。
比如,委屈的時(shí)候是這樣的
憤怒的時(shí)候是這樣
你開心啦,眉毛抖呀抖,是不是很丑
除了能快速的生成你個(gè)人的 3D VR 頭像,為了更像你,索性連你的語音也一起生成。
只要錄下兩分鐘的聲音,就可以借由語音模擬器,用同樣的聲音說話、唱歌,甚至可以講出流利的不同國家語言!
據(jù)說兩位創(chuàng)始人 NikhilJain 和 Adam Zheng 是因?yàn)橄胱屪约旱穆曇魰r(shí)常陪伴孩子,才創(chuàng)立了這家公司。
ObEN 使用的并不是簡單的語音合成技術(shù),它的技術(shù)可以捕獲完整的聲波紋。它不是記錄單個(gè)音節(jié),也不只是語調(diào),然后顆粒輸出。而是應(yīng)用深度學(xué)習(xí)語音合成,創(chuàng)建任何語言的數(shù)字聲紋。
比如,你是個(gè)美國人,使用 ObEN 技術(shù)錄下語音,獲取你的聲音后,可以用你的聲音來說中文,就好像你會說中文一樣。錄制聲音也不需要特殊的錄音棚,只要一個(gè)沒有太多背景噪音的地方。
結(jié)合以上兩點(diǎn),ObEN 可以構(gòu)建一個(gè)樣子像你、聲音像你,還有豐富表情的 3D VR 頭像。同時(shí),他還可以比你更厲害,唱你不會唱的歌,說你不會說的語言。
ObEN 的優(yōu)勢是將人臉 3D 重建和語音合成相結(jié)合,使得合成的虛擬形象更加貼近人類,這樣的話,我們是不是很快就能在虛擬世界里 “活過來” 呢?
今年 CES 期間,ObEN 接到了一個(gè)商業(yè)項(xiàng)目,給凱撒娛樂集團(tuán)旗下的 LINQ 酒店打造了一個(gè)微信機(jī)器人(用來迎賓)。
這個(gè)機(jī)器人叫 Ben,它可以在極短的時(shí)間內(nèi)識別語言、語音并做出反應(yīng)與使用者進(jìn)行交流。
除了點(diǎn)擊機(jī)器人 Ben 身上的觸摸屏幕面對面交流來獲取周邊信息,比如餐飲,娛樂表演,夜生活等等??腿艘部梢灾苯酉騽P撒娛樂集團(tuán)微信公號直接發(fā)送指令,和虛擬的 “Ben” 交流。
“你們這群愚蠢的人類,見了朕,還不下跪….”
應(yīng)用 ObEN 的語音識別技術(shù)以后,微信機(jī)器人可以將與之溝通者的聲音儲存一段時(shí)間,還可以把該聲音應(yīng)用到任何語言、任何內(nèi)容的表達(dá)之中。
最后,看 ObEN 的集體照,團(tuán)隊(duì)成員只有 20 幾人,但背景卻多元化。他們覆蓋了人工智能、機(jī)器深度學(xué)習(xí)(deep-learning)、語音識別/合成,以及電腦視覺 & 圖像預(yù)測等高度復(fù)雜的新領(lǐng)域,而且擁有多項(xiàng)專利和知名的專家顧問團(tuán)。hin有潛力啊!