《圣經(jīng)》中有一個故事:巴比倫人想建造一座塔直通天堂,上帝看到人類竟然敢做這種事情,就把人類的語言變得不一樣,人們從此聽不懂對方在講什么,無法繼續(xù)建造。
這座塔叫作巴別塔,假如能夠?qū)崿F(xiàn)不同語言都被理解,我們就可以實現(xiàn)世界上任何兩個人之間毫無障礙的交流和溝通,“重建巴別塔”也就成了可能,而這也正是人工智能的終極目標(biāo)之一。
“決策”,人工智能3.0時代的標(biāo)志
事實上,“人工智能”正式提出時,計算機國際象棋和機器翻譯就是人工智能的兩個標(biāo)志性目標(biāo),但直到國際象棋甚至圍棋都被AI攻克,機器翻譯的第一階段,即機器認(rèn)知智能的核心能力之一 —— 自然語言處理(NLP)能力依然無法和人類相比。
NLP大致包含三個技術(shù)層面:詞法分析、句法分析、語義分析,三者之間既遞進(jìn)又相互包含,這也構(gòu)成了NLP技術(shù)的最大瓶頸。由于詞句往往在具體的場景下?lián)碛胁煌暮x,人在理解時會基于已有知識儲備和上下文環(huán)境,然而人工智能目前還很難做到,沒有類似知識圖譜這樣強大的背景知識支撐,是不可能理解語言的。要讓機器理解我們?nèi)祟惖恼Z言,機器必需共享與我們類似的背景知識,還需要依賴深度學(xué)習(xí)技術(shù),這也就需要大規(guī)模甚至超大規(guī)模的數(shù)據(jù)積累,讓機器不斷訓(xùn)練和學(xué)習(xí)。
回首人工智能發(fā)展的60多年,經(jīng)歷了“算法為重”的1.0階段,現(xiàn)在則進(jìn)入“數(shù)據(jù)凸顯”的2.0階段,但真正步入“讓機器做明智決策”的3.0階段,還需要大量數(shù)據(jù)積累和技術(shù)的提升,實現(xiàn)認(rèn)知智能是當(dāng)前以及今后一段時間里AI發(fā)展的重要使命之一。
賽道擁擠,結(jié)合產(chǎn)業(yè)化者占據(jù)先機如同任何一個人工智能細(xì)分領(lǐng)域一樣,認(rèn)知智能這條賽道也帶給創(chuàng)業(yè)者大量機會。根據(jù)不完全統(tǒng)計,自然語言處理新創(chuàng)公司在2014年、2015年和2016年呈現(xiàn)公司成立激增的狀態(tài),但2017年公司創(chuàng)立有明顯的下滑狀態(tài)。據(jù)投行人士分析,一方面14年及先發(fā)成立的初創(chuàng)公司在時間、技術(shù)、融資方面已經(jīng)取得不小的優(yōu)勢,另一方面,大多創(chuàng)業(yè)公司聚焦技術(shù),缺少應(yīng)用場景開發(fā)和數(shù)據(jù)、人才儲備。
從熱轉(zhuǎn)冷現(xiàn)象的原因在于——不同于AI競賽或者人臉識別等“感知智能”階段,認(rèn)知智能技術(shù)進(jìn)步和產(chǎn)業(yè)化推進(jìn)是一種協(xié)同關(guān)系:人工智能企業(yè)通過特化的技術(shù)算法和產(chǎn)品,促進(jìn)產(chǎn)業(yè)化應(yīng)用,再根據(jù)實際應(yīng)用中的數(shù)據(jù)和反饋,反過來推動技術(shù)實現(xiàn)進(jìn)步。
目前各細(xì)分領(lǐng)域中,客服、教育、醫(yī)療、金融因為具備海量語音數(shù)據(jù)和較強產(chǎn)業(yè)需要,成為企業(yè)的兵家必爭之地。
AI+安防警務(wù)市場,認(rèn)知智能創(chuàng)新者另辟蹊徑而回顧2.0時代曠視、商湯等獨角獸的發(fā)展軌跡,我們會發(fā)現(xiàn)安防警務(wù)與人工智能天然契合。一方面,本領(lǐng)域數(shù)據(jù)量遠(yuǎn)超公司級別,另一方面,巨大的數(shù)據(jù)量又讓行業(yè)對機器輔助認(rèn)知和檢索效率產(chǎn)生需求,安防警務(wù)領(lǐng)域的創(chuàng)業(yè)巨頭正在崛起。從2015年AI技術(shù)的產(chǎn)品化引入,到2016、2017年國家大力建設(shè)和企業(yè)積極創(chuàng)新的共同作用,2018年,AI+安防行業(yè)進(jìn)入快速落地階段,科技開始真正賦能。
不同于在各企業(yè)扎堆以電話錄音為核心數(shù)據(jù),拓展to C行業(yè)的做法,安防警務(wù)領(lǐng)域是個極其特殊的市場,有獨特的產(chǎn)品需求。前期發(fā)展主要圍繞視頻監(jiān)控在不斷改革升級,但是2018年開始,公安大數(shù)據(jù)因為存在海量難處理的異構(gòu)數(shù)據(jù),且缺乏關(guān)聯(lián)性,無法在全警種智能應(yīng)用,基于NLP的知識圖譜等認(rèn)知智能技術(shù)的應(yīng)用成為了公安大數(shù)據(jù)建設(shè)的主流方向,該領(lǐng)域雖然起步時間短、份額較小,但發(fā)展?jié)摿?,隨著結(jié)構(gòu)化信息池的豐富, 大規(guī)模布控、社會治理場景中,知識圖譜將成為剛需。
據(jù)Rich AI睿企科技首席人工智能專家石江楓透露,睿企科技即使擁有全球領(lǐng)先的認(rèn)知智能技術(shù)實力,但如何真正挖掘和發(fā)揮隱藏在非結(jié)構(gòu)化的數(shù)據(jù)中的數(shù)據(jù)價值,團(tuán)隊通過1年多一線隨警了解業(yè)務(wù),在大量實戰(zhàn)經(jīng)驗的基礎(chǔ)上才“敢”讓技術(shù)在這個領(lǐng)域落地。通過語義分析來“喚醒”那些隱藏在非結(jié)構(gòu)化數(shù)據(jù)中的“沉睡的數(shù)據(jù)”,這也是睿企科技真正想做的事情--通過文本分析的方式,為公安行業(yè)帶來生產(chǎn)力。
石江楓認(rèn)為,警務(wù)行業(yè)有三要素:時間、傳承和情報。具體來說:一是時間對公安很重要,破案越快越容易打擊挽損;二是警察之間的有效溝通傳承很重要,通暢地交流才能進(jìn)行信息碰撞,將各自頭腦中的知識碰撞,讓知識成倍積累。比如3個民警10天看完3000頁材料,看完后必須進(jìn)行有效溝通,否則可能錯過情報細(xì)節(jié)和辦案線索。三是從海量數(shù)據(jù)中挖掘有效的情報很重要。認(rèn)知智能相關(guān)文本分析技術(shù)則通過感知、認(rèn)知、探索、發(fā)現(xiàn)和輔助決策步驟,將不易理解的數(shù)據(jù)變成直觀有料的情報,從閱讀理解效率上解決了時間問題,用文本分析結(jié)果解決了溝通和情報的問題,極大提升了民警辦案效率。
從感知、認(rèn)知、發(fā)現(xiàn)到?jīng)Q策,一層一層深入抽象核心信息,再以最直觀的方式呈現(xiàn),直接產(chǎn)生價值。通過數(shù)據(jù)中臺進(jìn)行全局的自動清洗,關(guān)聯(lián)理解和融合,送到文本分析平臺里面,進(jìn)行文本分析的認(rèn)知和理解。在文本分析的算法上,從不同的字、詞、句、文章和篇幅的角度來進(jìn)行理解。對于每個角度,從多角度構(gòu)建特征與深度模型,提取出需要的業(yè)務(wù)知識。睿企科技所做的不單單是語義模型,而是一個具有業(yè)務(wù)知識的人工智能工具,把語義分析的知識在業(yè)務(wù)場景下發(fā)揮出最大的作用。在語義計算模型上面,一方面會通過通用的語料庫進(jìn)行模型預(yù)訓(xùn)練。另外一方面,通過公安數(shù)據(jù),在不同的場景下給出不同的語義模型與實踐模型去滿足常用的需求。
近期,“睿企掃黑作戰(zhàn)應(yīng)用”輔助某市一起團(tuán)伙套路貸專案相關(guān)情報。據(jù)介紹,依據(jù)一名已知嫌疑人,該應(yīng)用能智能篩選案件信息,以個人時間軸形式組成時空分析,www.gzchunzheng.com突出矛盾事件和缺少描述事件,“最終案情用時間線方式進(jìn)行呈現(xiàn),并展示出犯罪團(tuán)伙的發(fā)展歷程,解決了組織頭目往往口供干貨較少,定罪困難的問題?!苯刂聊壳埃瑧?yīng)用已幫助警方將嫌疑人范圍擴大23%,擴展出十余名被害人,為群眾降低大量財產(chǎn)損失。
“給每個公安行業(yè)每個民警配備一個文本分析的大腦,去幫助他們提高辦案效率。解決在時間、傳承溝通、情報分析上的痛點,提高生產(chǎn)力,增效減負(fù),這也是睿企科技人一直努力奮斗的目標(biāo)!”石江楓表示。
人工智能正在進(jìn)行著突飛猛進(jìn)的發(fā)展,1.0和2.0時代巨頭的優(yōu)勢并不能阻擋創(chuàng)業(yè)公司的成長機會,通過深耕垂直領(lǐng)域和細(xì)分賽道,實現(xiàn)自我造血和快速成長,創(chuàng)業(yè)公司也有機會在這一新興產(chǎn)業(yè)中逐漸做大。