商湯科技用人工智能改造傳統(tǒng)行業(yè)挖掘藍(lán)海市場(chǎng)
商湯科技作為為人工智能技術(shù)的重要一員,商湯科技徐立絲毫不敢懈怠。專注于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)原創(chuàng)技術(shù),成為國(guó)內(nèi)最大的新銳人工智能公司,他表示我們進(jìn)入了軟件的摩爾定律時(shí)代,軟件性能通過(guò)人工智能快速增長(zhǎng),用人工智能改造傳統(tǒng)行業(yè)挖掘藍(lán)海市場(chǎng)。
今日人工智能時(shí)代完全變了,第四次工業(yè)革命尚未真正開(kāi)始,很多人已開(kāi)講。“全球進(jìn)入了一種未卜先知時(shí)代,這與抗日劇中喊八年抗戰(zhàn)馬上要開(kāi)始一樣。”徐立說(shuō)。
作為人工智能公司商湯科技聯(lián)合創(chuàng)始人兼CEO,徐立感受著創(chuàng)業(yè)的苦與樂(lè),以及時(shí)代的喧囂和嘈雜。一方面,商湯科技專注于計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)原創(chuàng)技術(shù),飛速發(fā)展,自主建立了原創(chuàng)深度學(xué)習(xí)平臺(tái)Parrots和深度學(xué)習(xí)超算中心,成為國(guó)內(nèi)最大的新銳人工智能公司,估值超過(guò)20億美金。
另一方面,各路人馬齊齊殺到這一領(lǐng)域。國(guó)內(nèi)外巨頭公司無(wú)不分出人馬研發(fā)人工智能,競(jìng)爭(zhēng)日趨激烈。從2015年開(kāi)始,只要一個(gè)論壇主題詞中出現(xiàn)人工智能幾個(gè)字,場(chǎng)場(chǎng)爆滿。
在這樣環(huán)境中,近三年人臉識(shí)別、自然語(yǔ)言處理和機(jī)器深度學(xué)習(xí)等等人工智能型公司紛紛創(chuàng)立。商湯科技是其中一員。2014年創(chuàng)立,經(jīng)過(guò)三年發(fā)展,商湯科技將人臉識(shí)別、圖像識(shí)別、自動(dòng)駕駛、人機(jī)交互、醫(yī)療圖像、人工智能芯片等多項(xiàng)人工智能核心技術(shù)實(shí)現(xiàn)應(yīng)用落地。
2017年7月,商湯科技宣布完成4.1億美元B輪融資,創(chuàng)下當(dāng)時(shí)全球人工智能企業(yè)單筆融資紀(jì)錄,同時(shí)也成為全球估值最高的人工智能獨(dú)角獸企業(yè)。
但是,商湯科技徐立絲毫不敢懈怠。新一輪融資后,他希望在包括無(wú)人駕駛、智慧醫(yī)療、深度學(xué)習(xí)芯片、增強(qiáng)現(xiàn)實(shí)平臺(tái)等方面加大研發(fā)投入以及人才引入,開(kāi)拓更多技術(shù)應(yīng)用場(chǎng)景,深化人工智能商業(yè)生態(tài),以原創(chuàng)技術(shù)賦能更多行業(yè)。
視頻分析大風(fēng)口移動(dòng)互聯(lián)網(wǎng)時(shí)代,每個(gè)人手機(jī)都會(huì)拍照很多照片,錄制短視頻。商湯科技聯(lián)合創(chuàng)始人之一楊帆注意到一個(gè)現(xiàn)象,這些照片和視頻二次價(jià)值轉(zhuǎn)化很小,其最重要的價(jià)值體現(xiàn)在拍完、分享那一刻,之后大多數(shù)人很少再次翻閱、利用這些照片。但是,它們占據(jù)了大量的手機(jī)存儲(chǔ)空間。“這是很矛盾的。” 楊帆說(shuō)。
基于這種洞察,商湯科技為手機(jī)廠商提供了一個(gè)智能相冊(cè)解決方案,即利用人臉識(shí)別聚類技術(shù),按照不同人像進(jìn)行歸類,實(shí)現(xiàn)“一人一相冊(cè)”,輕松解決手機(jī)中成百數(shù)千張照片分類管理的難題。該方案還能找到手機(jī)中照片最多的那個(gè)小孩,從大概率來(lái)說(shuō),“那是用戶自己的小孩,系統(tǒng)會(huì)將該照片推薦給手機(jī)用戶做屏保”,其余照片或者可以存儲(chǔ)到云端,或者利用其它技術(shù)處理,實(shí)現(xiàn)照片的二次價(jià)值轉(zhuǎn)化。
這是一個(gè)并不復(fù)雜的實(shí)際應(yīng)用案例。再往下發(fā)展,隨著AI技術(shù)進(jìn)步,楊帆相信可以從照片和視頻中挖掘更價(jià)值。
商湯科技研發(fā)的智能相冊(cè)、美顏和濾鏡功能,有些已應(yīng)用到華為和小米手機(jī)上。借助此類方式,商湯科技的技術(shù)已經(jīng)悄無(wú)聲息影響到很多人。
11月2日,最新發(fā)布的OPPO旗艦手機(jī)R11s上,應(yīng)用了商湯科技提供的AI智慧美顏技術(shù)和 “面部識(shí)別”人臉解鎖功能。
通俗來(lái)講,這類應(yīng)用后面的實(shí)現(xiàn)方式與人臉定位、AI特效增強(qiáng)相關(guān),算法的選擇尤其關(guān)鍵。
技術(shù)落地經(jīng)歷了一個(gè)有意思過(guò)程。楊帆最早預(yù)設(shè)各類場(chǎng)景,抽象出106點(diǎn)來(lái)。最初從5個(gè)點(diǎn),2個(gè)眼睛、1個(gè)鼻子、2個(gè)嘴角,接著衍生出21個(gè)定位點(diǎn)。接下來(lái)是38個(gè)點(diǎn),最后是106個(gè)點(diǎn)位。
理論上來(lái)說(shuō),點(diǎn)位越多越準(zhǔn)確。操作時(shí)要兼顧人工標(biāo)注數(shù)據(jù)成本,一張106點(diǎn)的標(biāo)注圖,成本要5-10元。從標(biāo)注十萬(wàn)張照片起步,5個(gè)點(diǎn)位全部標(biāo)出來(lái),訓(xùn)練出一個(gè)5點(diǎn)模型,再進(jìn)化,將21點(diǎn)算法等融合到標(biāo)注工具,然后就可做到更快、更低成本標(biāo)注。
最后,商湯倡導(dǎo)的106點(diǎn)標(biāo)注得到非常廣泛的應(yīng)用,積累到百萬(wàn)級(jí)別數(shù)據(jù)時(shí),可以通過(guò)類似方法去以較低成本標(biāo)注240個(gè)點(diǎn)。
類似技術(shù)成熟后,為商湯打開(kāi)了進(jìn)入短視頻和直播業(yè)務(wù)通路。商湯正在進(jìn)入一個(gè)技術(shù)進(jìn)步帶來(lái)數(shù)據(jù)積累,進(jìn)而做到產(chǎn)業(yè)化落地的正向循環(huán)。
商湯想解決計(jì)算機(jī)識(shí)物之后,真正把視頻理解發(fā)揮到一個(gè)真實(shí)應(yīng)用場(chǎng)景當(dāng)中。現(xiàn)在,視頻分析能力可以認(rèn)出人的身份,周圍的桌子、凳子和沙發(fā),還有顏色。再進(jìn)一步發(fā)展下去還有很大可能性。
比如,搜索引擎公司現(xiàn)在只是基于文本,如果對(duì)于整個(gè)視頻理解能做到文本搜索水平,未來(lái)可以成為視頻搜索引擎。當(dāng)然這只是商業(yè)上想象的一部分。
按照徐立和團(tuán)隊(duì)設(shè)想,人工智能對(duì)當(dāng)前互聯(lián)網(wǎng)主要的商業(yè)領(lǐng)域電商、搜索和游戲都將產(chǎn)生影響,另外,還外對(duì)安防、智能駕駛等等領(lǐng)域賦能,未來(lái)前景廣闊。