注重交互將是企業(yè)服務(wù)機(jī)器人未來大趨勢(shì)
人工智能有三大領(lǐng)域:視覺、語音、語義。其中,圖像和語音算法成熟度已經(jīng)很高,且要遠(yuǎn)遠(yuǎn)高于語義。在中文機(jī)器閱讀理解比賽中,人的準(zhǔn)確率大概是 95%,機(jī)器做到的最高水平只有 80%,還有 15% 的差距,這是一個(gè)挑戰(zhàn),也是一個(gè)機(jī)會(huì)。
具體應(yīng)用上,目前來看,比較多的人工智能公司,首先需要在企業(yè)服務(wù)方面落腳,這是最容易看到的商業(yè)模式,也是 AI 技術(shù)最容易被認(rèn)可的一個(gè)商業(yè)模式。
企業(yè)服務(wù)機(jī)器人 VS 聊天機(jī)器人,差別在哪?
今天主要針對(duì)企業(yè)服務(wù)機(jī)器人展開介紹。
首先說下企業(yè)服務(wù)機(jī)器人和聊天機(jī)器人的差別。第一,聊天機(jī)器人一般是虛擬形象,說話不要求很嚴(yán)謹(jǐn),反而是比較風(fēng)趣,這種機(jī)器人一般叫情感陪護(hù)型機(jī)器人。而企業(yè)服務(wù)機(jī)器人代表企業(yè)形象,代表企業(yè)去服務(wù)顧客,表達(dá)和對(duì)話都比較嚴(yán)謹(jǐn),說話要負(fù)責(zé),不能隨便回答。
第二,兩種機(jī)器人的技術(shù)路徑也不一樣,企業(yè)服務(wù)機(jī)器人是一個(gè)垂直領(lǐng)域,在專業(yè)領(lǐng)域和用戶對(duì)話,而不是開放的聊天,從這個(gè)角度來看技術(shù)難度變輕了;但是和通用機(jī)器人相比,它對(duì)準(zhǔn)確率要求更高。
然后接下來,我們來探討怎么做好企業(yè)服務(wù)機(jī)器人。
想做一個(gè)客服機(jī)器人,核心要把語義理解、意圖理解做好。舉個(gè)例子,一個(gè)電商產(chǎn)品不同用戶有不同的反饋,比如“要買的裙子怎么沒有腰帶?”或者“充電器為什么沒有一起寄過來?”這些問題看起來很雜,但背后語義都是同一個(gè),就是商品零配件少發(fā)了。
在解決意圖理解上,技術(shù)路線上經(jīng)歷了好幾輪變遷。2000 年左右就已經(jīng)有企業(yè)服務(wù)機(jī)器人這種產(chǎn)品形態(tài),只是當(dāng)時(shí)解決意圖理解的技術(shù)比較簡(jiǎn)陋。早期是用本體 + 句法模板的方式來實(shí)現(xiàn),比如用本體完成理解詞的問題,用句法模板完成理解對(duì)句的問題。
隨后像百度、Google 等公司興起以后,搜索技術(shù)也被用在客服機(jī)器人里。在這個(gè)階段,一般用同義詞的方式解決詞關(guān)系的問題,用詞權(quán)重解決抽象核心語義的問題,用文本相關(guān)性解決匹配的問題。
再后來深度學(xué)習(xí)技術(shù)出現(xiàn),在語義理解上,深度學(xué)習(xí)相比之前的技術(shù)有很大提升。
基于深度學(xué)習(xí)的語義理解
那么深度學(xué)習(xí),又是如何解決語義理解?
在計(jì)算機(jī)里面,用文本方式表示的語言,比如漢語和英文,是一種符號(hào),但這不是計(jì)算機(jī)能理解的符號(hào)。計(jì)算機(jī)可以理解的是向量和矩陣,無論是語音、圖像還是語言,深度學(xué)習(xí)都是把這些原始信號(hào)轉(zhuǎn)換成計(jì)算機(jī)能理解的向量和矩陣,才能更好地做計(jì)算。
首先完成將語言當(dāng)中的詞轉(zhuǎn)換為向量,然后通過一個(gè)深度神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化成句的向量,再通過句的向量進(jìn)行更豐富的計(jì)算。
這個(gè)過程中,會(huì)用到注意力模型,注意力模型最早來源于圖像理解。舉個(gè)例子,人進(jìn)入到會(huì)議室,首先不會(huì)去注意有多少板凳,雖然板凳這些信息占據(jù)面挺大,但人首先會(huì)挑選自己注意的東西去看,比如說注意來了哪些人,因?yàn)槿嗽谟|摸信號(hào)時(shí)會(huì)選擇性地去挑選。語言也是這樣,用戶說了很長(zhǎng)一段話,注意力模型能夠在很長(zhǎng)的文本中,發(fā)現(xiàn)用戶主要表達(dá)的信號(hào)。比如一個(gè)用戶說“昨天剛收到貨,今天天氣不錯(cuò),和朋友一起出去玩,一劈腿褲子開衩了”,前面的話都沒有意義,他最想表達(dá)的意思是褲子開縫了,是想退貨或換貨。對(duì)于一個(gè)客服機(jī)器人來說,這是它要抓住的重點(diǎn)。
注意力模型之后是映射層,相當(dāng)于完成一個(gè)歸一化,之后機(jī)器人才知道怎么去回復(fù)用戶。
閱讀理解
剛才講的都是需要人事先把知識(shí)庫(kù)整理好給機(jī)器人用,為在線機(jī)器人去解析、調(diào)用、推理。還有一類,可能所有的知識(shí)都是一些原始文檔,它們沒有形成知識(shí)庫(kù)。比如一家銀行有很多線下商家優(yōu)惠活動(dòng)的書面文檔,這類活動(dòng)經(jīng)常更新替換,沒有人可以完全記住這些文檔內(nèi)容,反而是機(jī)器比較擅長(zhǎng)做這個(gè)事情。假設(shè)有一個(gè)用戶問題,需要從文檔當(dāng)中找答案,首先機(jī)器要找到哪個(gè)文檔可以解答,再找到文檔當(dāng)中哪一句話可以解答,這個(gè)過程叫閱讀理解。
閱讀理解在國(guó)外比賽已經(jīng)做的挺久,國(guó)內(nèi)才剛剛開始,這一塊的技術(shù)還是比較新。
機(jī)器人知識(shí)庫(kù)的運(yùn)營(yíng)
剛才講了客服機(jī)器人在線處理用戶的請(qǐng)求,理解用戶的請(qǐng)求,其實(shí)客服機(jī)器人還做了很多離線的工作。一個(gè)機(jī)器人并不僅僅是一個(gè)在線的服務(wù),它是一個(gè)離線服務(wù)和在線服務(wù)同時(shí)包含的系統(tǒng)工程。
機(jī)器人解答不了用戶的問題,有時(shí)候并不是因?yàn)橐鈭D理解不夠好,而是機(jī)器人沒有知識(shí)去應(yīng)對(duì)當(dāng)前的回答。這就是知識(shí)庫(kù)運(yùn)營(yíng)所要解決的問題,有幾個(gè)方面:
一是新知識(shí)點(diǎn)的發(fā)現(xiàn)。有些熱點(diǎn)的知識(shí)點(diǎn)用戶已經(jīng)在問,但是知識(shí)庫(kù)里面是缺失的,這部分問題可以交給運(yùn)營(yíng)人員添加相應(yīng)的問題回答。
二是知識(shí)點(diǎn)的細(xì)化。一開始機(jī)器人的知識(shí)點(diǎn)沒有深入到用戶的問題細(xì)節(jié)里面,這種情況可以細(xì)化,把一個(gè)知識(shí)點(diǎn)拆分成多個(gè)知識(shí)點(diǎn)。
三是知識(shí)點(diǎn)的優(yōu)化。比如說客戶看到了機(jī)器人回答,但是仍然轉(zhuǎn)人工了,這是因?yàn)榇鸢覆]有解決問題,說明答案需要進(jìn)一步優(yōu)化。
機(jī)器人的產(chǎn)品能力
除了返回用戶答案外,機(jī)器人還需要更多能力,優(yōu)化產(chǎn)品和運(yùn)營(yíng)。
一是熱點(diǎn)分析。比如在一個(gè)電商后臺(tái)系統(tǒng)中,用戶請(qǐng)求有集中性或爆發(fā)性,那很可能是產(chǎn)品上集中的事故,這種現(xiàn)象跟產(chǎn)品運(yùn)營(yíng)息息相關(guān)。
二是輿情分析,可以挖掘用戶在客服渠道里面經(jīng)常會(huì)問什么問題。舉個(gè)電商的例子,用戶在問到奶粉這個(gè)詞時(shí),最關(guān)注的正品、渠道商、產(chǎn)地,還有品牌。通過這個(gè)方法,可以判斷用戶在關(guān)注某個(gè)商品的時(shí)候更關(guān)注哪些點(diǎn)。
三是情感分析。用戶在訪問機(jī)器人時(shí),是正向情感、中性情感還是負(fù)向情感?這些可以通過技術(shù)手段識(shí)別出來。我們做過某個(gè)客戶的統(tǒng)計(jì),在售后客服機(jī)器人場(chǎng)景,中性和負(fù)向的情感占比較高,那就說明售后來找客服都是吐槽的??梢园堰@些負(fù)向的情感反應(yīng)細(xì)化處理,比如分幾個(gè)檔次,分別對(duì)應(yīng)后續(xù)不同的處理。負(fù)向情感比較嚴(yán)重,就可以讓機(jī)器人自動(dòng)轉(zhuǎn)人工。
最后是敏感分析,這一點(diǎn)對(duì)于客服機(jī)器人非常重要。我們發(fā)現(xiàn),不同行業(yè)有不同敏感信息定義。比如外賣,比較敏感的信息就是食品健康。對(duì)于電商,假貨就是比較敏感的信息。一般遇到這些敏感信息機(jī)器人會(huì)主動(dòng)轉(zhuǎn)人工,交給人工客服處理。
機(jī)器人大趨勢(shì):將來更注重交互
前面我們講了企業(yè)服務(wù)機(jī)器人的特點(diǎn)、如何解決語義理解、背后依托知識(shí)庫(kù)以及產(chǎn)品能力,最后我想講下企業(yè)服務(wù)機(jī)器人趨勢(shì)。
大家一開始認(rèn)為企業(yè)服務(wù)機(jī)器人是客服機(jī)器人,主要是解決節(jié)省人工成本,后來發(fā)現(xiàn),它其實(shí)是企業(yè)的虛擬助手。包括 Gartner 最近的報(bào)告,預(yù)測(cè)到 2020 年有 20% 的用戶訪問企業(yè)服務(wù)時(shí),首選的是對(duì)話式的入口。
以前 PC 時(shí)代訪問銀行網(wǎng)站,網(wǎng)頁(yè)每個(gè)菜單對(duì)應(yīng)辦理某個(gè)業(yè)務(wù)的入口。到移動(dòng)手機(jī)時(shí)代,屏幕沒有那么大,APP 能放的入口也沒有那么多,客戶都想快速找到業(yè)務(wù)入口。如果放搜索框放在 APP 最上面,通過搜索功能,搜索“修改密碼”會(huì)出來十幾條修改密碼的入口,用戶也不知道哪一條,體驗(yàn)并不好。
所以,將來可能更多會(huì)是對(duì)話交互的方式,這是未來的趨勢(shì)。比如說修改密碼,機(jī)器就會(huì)反問你想修改什么密碼,再根據(jù)你提供的信息,給你具體操作頁(yè)面。
通過用戶和機(jī)器人的交互,把用戶畫像沉淀下來,跨越時(shí)間和空間把用戶畫像融合在一起,對(duì)營(yíng)銷、推薦和風(fēng)控做一些數(shù)據(jù)上的支持??头行膹囊粋€(gè)成本中心轉(zhuǎn)變?yōu)橐粋€(gè)用戶研究中心,這也是一個(gè)趨勢(shì)。
以上是我今天分享的企業(yè)服務(wù)機(jī)器人內(nèi)容,感謝聆聽,謝謝大家!
如何去判斷一個(gè)人的情緒,然后根據(jù)他的情緒進(jìn)行之后的問答操作?
這個(gè)就是剛才講到的情感分析,它包括兩個(gè)方面,一個(gè)是文本,一個(gè)是語音,文本里通過相關(guān)詞語可以去識(shí)別,語音會(huì)包含一些聲調(diào)、語速。對(duì)情感的判斷是滿意還是不滿意,也是用深度學(xué)習(xí)的方法,相當(dāng)于是文本分類來解決這個(gè)問題,每個(gè)人溝通表達(dá)的方式不一樣,想識(shí)別出來還是有點(diǎn)難的。如果是用關(guān)鍵詞的方法,這個(gè)問題確實(shí)是很難解決好,用深度學(xué)習(xí)的方法會(huì)好很多。
現(xiàn)在的語音識(shí)別的瓶頸?
方言這一塊大家都做的不太好,訊飛是做的比較好的一家。這需要數(shù)據(jù)的積累,沒見過的方言仍然識(shí)別不出來,這是一個(gè)門檻。另一個(gè)門檻是垂直領(lǐng)域,如果語音識(shí)別系統(tǒng),沒有一個(gè)垂直行業(yè)的訓(xùn)練數(shù)據(jù),也做不好。現(xiàn)在人工智能對(duì)數(shù)據(jù)依賴還是比較高的,人工智能的競(jìng)爭(zhēng)有時(shí)候就是數(shù)據(jù)競(jìng)爭(zhēng)。
券商這一類的主要是應(yīng)用到哪些場(chǎng)景?
券商對(duì)知識(shí)圖譜要求比較高,希望通過機(jī)器人能夠做到問股選股,比如查詢“市盈率大于 20、小于 25 的股票”,比如查詢“A 公司去年和今年相比市盈率變化多少”。在機(jī)器人的知識(shí)庫(kù)沒有現(xiàn)成的答案,需要通過推理才獲得答案,再把它過濾出來。另外是投資教育這一塊比較多,經(jīng)常會(huì)問港股通怎么收費(fèi)等等。還有資料查詢,主要是問某支股票的信息,比如說法人、去年的財(cái)報(bào)。