人工智能發(fā)展的現(xiàn)狀調(diào)研
人工智能將在2-3年內(nèi)在國(guó)內(nèi)市場(chǎng)形成更大規(guī)模的落地效應(yīng),包括新興領(lǐng)域和傳統(tǒng)行業(yè)。在人工智能落地的動(dòng)力與瓶頸方面,數(shù)據(jù)問(wèn)題應(yīng)該受到足夠的重視。隨著人工智能從云到端的發(fā)展,端側(cè)芯片競(jìng)爭(zhēng)會(huì)更為激烈,背后考驗(yàn)的還有軟件支持、生態(tài)、服務(wù)等因素。
針對(duì)AI會(huì)在多久之內(nèi)改變企業(yè)和所處行業(yè)發(fā)現(xiàn),有35%的人認(rèn)為會(huì)在2-3年之內(nèi)人工智能將會(huì)改變其企業(yè),同時(shí)有27%的人認(rèn)為4-5年內(nèi)人工智能將改變其所處的行業(yè),盡管現(xiàn)在國(guó)內(nèi)AI還處于發(fā)展的早期,但是大家對(duì)于AI的發(fā)展有較為明確的共識(shí)。對(duì)于初創(chuàng)企業(yè)來(lái)講,競(jìng)爭(zhēng)時(shí)間非常緊張,在未來(lái)2-3年,最晚4-5年之內(nèi),需要盡力提升差異化競(jìng)爭(zhēng)的優(yōu)勢(shì)。
根據(jù)調(diào)研分析,企業(yè)用戶選擇AI的首選驅(qū)動(dòng)因素就是可以提升效率,其次原因?yàn)楣?jié)約成本,再次為提升用戶體驗(yàn)、提升數(shù)據(jù)分析能力,還有其他諸如輔助接觸、客戶畫像、差異化服務(wù)等因素。其實(shí)AI作為一項(xiàng)通用的技術(shù),未來(lái)將滲透到我們生活的方方面面,對(duì)于企業(yè)來(lái)講,是否能夠真正的用AI理念、技術(shù)去構(gòu)筑核心競(jìng)爭(zhēng)力,也是未來(lái)決勝的一個(gè)關(guān)鍵。
2018年AI大規(guī)模落地,碎片化應(yīng)用場(chǎng)景開(kāi)始廣泛滲透。AI應(yīng)用最多的領(lǐng)域包含消費(fèi)級(jí)產(chǎn)品與服務(wù)行業(yè)(對(duì)話式AI)、醫(yī)療行業(yè)(AI輔助影像診斷)、零售行業(yè)(智能貨柜)、制造業(yè)(產(chǎn)品分揀)、金融行業(yè)(反欺詐、對(duì)話式客服)、互聯(lián)網(wǎng)行業(yè)(內(nèi)容審核、產(chǎn)品推薦)等;典型的AI應(yīng)用于創(chuàng)新實(shí)踐的包含刷臉支付、無(wú)人零售、攝像頭、音箱、速記員、視頻換臉、實(shí)時(shí)翻譯耳機(jī)、手持翻譯機(jī)、語(yǔ)音助手、電話客服、醫(yī)學(xué)影像診斷、AI-IoT等,這些是一些碎片化的比較典型的應(yīng)用場(chǎng)景,以語(yǔ)音和圖像居多。
現(xiàn)階段,推動(dòng)AI創(chuàng)新與應(yīng)用落地的因素:大數(shù)據(jù)是基礎(chǔ),算法是核心,芯片是高地,人才是關(guān)鍵,選定垂直的細(xì)分領(lǐng)域非常的重要。AI的人才問(wèn)題相比過(guò)去幾十年的發(fā)展,已經(jīng)不是主要的瓶頸,我們國(guó)家有勤勉的人才,國(guó)家戰(zhàn)略層面也非常重視人才問(wèn)題。現(xiàn)在主要探討芯片、算法和數(shù)據(jù),這些已經(jīng)成為限制AI發(fā)展的關(guān)鍵因素。
用戶在開(kāi)發(fā)使用AI芯片類型的以深度學(xué)習(xí)為代表的AI計(jì)算需求,主要是以FPGA、ASIC、GPU這種適合并行計(jì)算的通用芯片來(lái)實(shí)現(xiàn)加速的。隨著產(chǎn)業(yè)環(huán)境的日漸成熟,真正的面向算法,在性能、功耗、面積等方面去進(jìn)一步優(yōu)化的全定制化芯片會(huì)具有越來(lái)越大的規(guī)模。隨著AI從云到端的發(fā)展,端側(cè)芯片的競(jìng)爭(zhēng)會(huì)更加激烈,但是從表面看,這些芯片在暗較長(zhǎng)短,每一種芯片都有各自的優(yōu)勢(shì)和短板所在。其實(shí)不存在某一種芯片能夠吃遍所有的應(yīng)用,因?yàn)槌诵酒?,背后考?yàn)的還有軟件支持、生態(tài)、服務(wù)等因素。
ARM的占有率非常高,達(dá)到了35%,ARM其實(shí)是把握了其核心的價(jià)格優(yōu)勢(shì),在此基礎(chǔ)上迅速構(gòu)建生態(tài)。由此來(lái)看,在一個(gè)新的應(yīng)用來(lái)臨之時(shí),往往也是行業(yè)在加速洗牌的時(shí)候。有越來(lái)越多的初創(chuàng)企業(yè)開(kāi)始芯片方面的布局,其中的算法公司居多,當(dāng)這些公司真正能夠?qū)崿F(xiàn)軟硬一體化時(shí),對(duì)下一步落地應(yīng)用和公司未來(lái)的發(fā)展戰(zhàn)略、融資上市等都會(huì)有一些幫助。
排名前幾的分別有華為HiKey970為23%、瑞芯微RK3399Pro為21%、威盛Edge AI人工智能開(kāi)發(fā)套件為13%等。華為HiKey970集成了華為Hi AI框架,以主流的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行深度學(xué)習(xí)算法開(kāi)發(fā)。瑞芯微RK3399Pro是面向嵌入式應(yīng)用的,是一款arm架構(gòu)的開(kāi)發(fā)板,集設(shè)計(jì)、芯片調(diào)試和芯片驗(yàn)證與一體。工程師對(duì)于開(kāi)發(fā)套件方面有呼聲比較高的一些建議和期待,如進(jìn)一步降低開(kāi)發(fā)難度、開(kāi)源、更豐富的產(chǎn)品、快速搭建社區(qū)資源等幾方面。
算法是AI的基礎(chǔ)和核心。從調(diào)研結(jié)果分析來(lái)看,背后有g(shù)oogle強(qiáng)大支撐的TensorFlow處于領(lǐng)先狀態(tài),市占率達(dá)到23%。第二名是背后有Facebook支持的PyTorch,市占率達(dá)到13%,它雖然還很年輕,但可以支持TensorFlow不支持的一些定制,所以發(fā)展非常的迅速。第三名是占比達(dá)到9%的caffe2,也是Facebook的另一款開(kāi)源產(chǎn)品。
算法框架同樣凸顯了生態(tài)資源的拉動(dòng)效應(yīng),我們也期待未來(lái)在核心前沿的領(lǐng)域能夠有更多的中國(guó)算法框架上榜?,F(xiàn)在即將進(jìn)入人和AI協(xié)作的時(shí)代,人機(jī)交互走向自然人機(jī)交互,最終目標(biāo)是實(shí)現(xiàn)人機(jī)協(xié)同。自然人機(jī)交互中界面并不是最重要的因素,貫穿于人機(jī)交互發(fā)展始終的是用戶體驗(yàn),像語(yǔ)音交互技術(shù)逐步發(fā)展,從單輪到多輪對(duì)話,合成語(yǔ)音更為自然、真實(shí)的接近真人水平。
人臉、手勢(shì)等更多通道出現(xiàn),多通道的融合交互成為未來(lái)主流。像觸控、語(yǔ)音、手勢(shì)、人臉等最有可能成為多通道融合的主流通道,甚至觸覺(jué)、嗅覺(jué)也有可能納入多通道交互中。
人機(jī)協(xié)同就是通過(guò)感知、認(rèn)知決策,最終實(shí)現(xiàn)從真實(shí)世界到數(shù)字世界的技術(shù)閉環(huán)。現(xiàn)階段機(jī)器與人的協(xié)作是從識(shí)別人開(kāi)始,我們所做的事情就是通過(guò)人臉識(shí)別、聲音識(shí)別給設(shè)備裝上眼睛、耳朵。目前的熱點(diǎn)技術(shù)如前端快速識(shí)別、遠(yuǎn)距離大規(guī)模識(shí)別、3D的精細(xì)化建模、多模態(tài)識(shí)別交互等均為人機(jī)協(xié)作的初級(jí)階段。 終極目標(biāo)是通過(guò)融合交互提升機(jī)器的智能化,讓機(jī)器更懂你,交互更自然。