科大訊飛李繁:多生物特征融合認(rèn)證能極大降低誤識率
李繁是科大訊飛云平臺事業(yè)部人臉聲紋技術(shù)主管,作為研發(fā)負(fù)責(zé)人參與構(gòu)建了面向十億級互聯(lián)網(wǎng)用戶提供語音交互服務(wù)能力的“訊飛開放平臺”,負(fù)責(zé)平臺身份驗(yàn)證業(yè)務(wù)線技術(shù)孵化與能力輸出。以下筆者整理的李繁近期在一公開課上分享的內(nèi)容:
大家晚上好,我是科大訊飛的李繁??拼笥嶏w在語音技術(shù)方面的基礎(chǔ)研究時間超過了16年,目前正構(gòu)建人工智能生態(tài)圈,擁有專門面向互聯(lián)網(wǎng)開放的人工智能開放平臺,輸出各項(xiàng)核心的前沿技術(shù)。
目前,生物特征識別技術(shù)已經(jīng)逐步在金融領(lǐng)域推廣使用。上一期鈦客們分享了人臉識別技術(shù)(鈦坦白干貨)和虹膜識別(鈦坦白干貨)在金融領(lǐng)域的應(yīng)用,也對這些生物特征為何能應(yīng)用金融領(lǐng)域的特性做了說明。今天我主要從技術(shù)解決方案角度來說明,多生物特征融合認(rèn)證系統(tǒng)一個基于人臉識別技術(shù)與聲紋識別技術(shù)為接入點(diǎn),可同時對多種生物特征進(jìn)行融合認(rèn)證的身份驗(yàn)證解決方案。
早前,國際生物特征組織分別從干擾用戶程度,獨(dú)立性,費(fèi)用代價(jià),易用性這四個層面對市場上在用的生物特征進(jìn)行了系統(tǒng)的統(tǒng)計(jì)分析,分析包括掌紋識別,簽名識別,指紋識別,語音識別,虹膜識別,視網(wǎng)膜識別,臉部識別以及溫譜識別。提出,理想的生物特征系統(tǒng)需要具備高獨(dú)特性,高易用性,對用戶干擾程度低且費(fèi)用代價(jià)低的特性。從這里可以看出,在人類認(rèn)知范圍內(nèi)的聲紋識別、人臉識別技術(shù)和簽名識別技術(shù)以及人類認(rèn)知范圍外的指紋識別,虹膜識別,和掌紋識別,為何能在各自的領(lǐng)域中發(fā)揮著重要的作用。
聲紋識別技術(shù)和人臉識別技術(shù)能夠被用作便捷的身份認(rèn)證形式,與其擁有的特點(diǎn)是分不開的,首先這些生物特征與生俱來的,具備唯一性,不易被復(fù)制。其次,這些特征都是易采集且采集隱蔽性較強(qiáng),無需新增硬件成本還能夠被遠(yuǎn)程操作。
以聲紋技術(shù)來說,聲紋是根據(jù)語音波形中反映說話人心理和行為特征的語音參數(shù),自動識別說話人身份,每個人無論別人說話模仿的多么相似,他都具有獨(dú)一無二的聲紋。這是由每個人的發(fā)聲器官在成長過程中形成的,這個唯一性能夠唯一確定一個用戶的身份。
訊飛是國內(nèi)最早開始研究聲紋識別技術(shù)且最早達(dá)到實(shí)用級別的廠商,在提出多生物特征融合認(rèn)證解決方案之前,就已經(jīng)為公共安全部門和金融機(jī)構(gòu)提供了相關(guān)技術(shù)支持。作為身份驗(yàn)證的一種方式,自然說話中即可確定身份,接受度較高。
聲紋識別模式目前對外支持了聲紋自由說、動態(tài)數(shù)字密碼、開放文本密碼、固定文本密碼。如下圖,各種識別模式均有其對應(yīng)的應(yīng)用場景。動態(tài)數(shù)字密碼因其使用便捷性,已成為金融支付中最為廣泛的聲紋識別模式。
在這個領(lǐng)域中聲紋識別主要用途分為兩種,與人臉識別相似,一是聲紋確認(rèn),即1:1比對,二是聲紋鑒別,即1:N比對。聲紋確認(rèn)直接使用待校驗(yàn)人的聲紋模型數(shù)據(jù)與注冊時的聲紋模型數(shù)據(jù)比對,得出一個相似度得分,而聲紋鑒別在一組模型中找出與待校驗(yàn)人相似度最高的聲紋發(fā)音者,當(dāng)然這個相似度得分能否作為判斷是本人的依據(jù),需要應(yīng)用根據(jù)其容忍度進(jìn)行來設(shè)置。
下面來說一下聲紋識別技術(shù)的效果衡量標(biāo)準(zhǔn)(這個效果衡量標(biāo)準(zhǔn)的實(shí)質(zhì)就是安全性與易用性間的權(quán)衡):
錯誤接受率(False Accept Rate),指非本人被錯誤的認(rèn)為是本人的次數(shù)占聲紋冒人操作次數(shù)的比值;
錯誤拒絕率(False Reject Rate),指本人被錯誤的認(rèn)為是非本人的次數(shù)占聲紋確認(rèn)操作次數(shù)的比值;
相等錯誤率(Equal Error Rate),指FA等于FR時的百分比。是衡量聲紋驗(yàn)證效果的重要依據(jù)。
至此,想必大家對聲紋識別技術(shù)以及人臉識別技術(shù)都有了一個基本的認(rèn)識。
可能有人會問,現(xiàn)在的人臉識別作為一種支付認(rèn)證手段已經(jīng)在市場上推廣使用了,而且普遍反饋效果很好,為什么還要去做這個多生物特征融合?以人臉識別技術(shù)來說,在最新的deepID2算法下,人臉的分辯能力能夠達(dá)到99.47%,但是在實(shí)際的應(yīng)用中還面臨著各種挑戰(zhàn),比如說大家都能感受到的一個比較大的挑戰(zhàn)就是,我們旁邊的這些韓國小姐;當(dāng)然,聲紋識別技術(shù)同樣也有應(yīng)用上的挑戰(zhàn),比如說聲紋易變形,易受身體狀況、年齡、情緒等方面的影響,實(shí)際使用中會受到錄音設(shè)備的影響。所以說,作為單一的生物特征認(rèn)證有一定的不穩(wěn)定性和局限性。
為應(yīng)對支付領(lǐng)域的高安全性需求同時解決單一生物特征的不穩(wěn)定性和局限性,提出了多生物特征融合認(rèn)證解決方案,多生物特征融合的核心基礎(chǔ)就是特征間的獨(dú)立性和互補(bǔ)性,從不同維度對兩種生物特征進(jìn)行融合計(jì)算,能夠最大限度的利用兩種生物特征的優(yōu)點(diǎn),同時能夠從一定程度上降低誤識率,比如說剛才提到聲紋變形或錄音設(shè)備的影響。
多生物特征融合認(rèn)證解決方案是一整套的互聯(lián)網(wǎng)解決方案,關(guān)鍵特性包括:
1、 統(tǒng)一接入方式,云服務(wù)持續(xù)優(yōu)化升級,對于后續(xù)新開放的生物特征能夠靈活接入,集成應(yīng)用可以根據(jù)需要靈活選擇新切入的生物特征。
2、 自定義安全閾值,結(jié)合應(yīng)用場景設(shè)置安全級別,對于支付認(rèn)證這種安全要求較高的領(lǐng)域中可以設(shè)置當(dāng)所有生物特征都必須全部匹配時才認(rèn)為確認(rèn)無誤,而在對安全性要求不高的領(lǐng)域中,比如打卡系統(tǒng),可以設(shè)置當(dāng)任意一種生物特征的匹配度符合標(biāo)準(zhǔn)都予以通過。采用這種方式能在保障校驗(yàn)準(zhǔn)確度的同時有效的提高通過率。
3、 閉環(huán)的安全校驗(yàn),能夠?yàn)閼?yīng)用提供閉環(huán)的安全校驗(yàn)交互,避免特征交互過程中被篡改或者偽造,同時特征的傳輸通道采用多層加密的方式。
多生物特征融合認(rèn)證解決方案在支付領(lǐng)域里面的應(yīng)用,下面為大家舉幾個例子,
1、2015年8月,科大訊飛聯(lián)合中國銀聯(lián)和徽商銀行發(fā)布了 “聲紋+人臉”融合認(rèn)證個人轉(zhuǎn)帳應(yīng)用,是第一款采用多生物特征融合技術(shù)在移動支付領(lǐng)域的產(chǎn)品,能夠有效防范圖片或者視頻回放的欺詐風(fēng)險(xiǎn)。在綁定銀行卡環(huán)節(jié)中,還應(yīng)用了自動識別身份證和銀行卡的功能,顯著簡化了用戶的操作。
2、2016年的2月,徽商銀行正式發(fā)布帶有人臉聲紋識別功能的手機(jī)銀行版本,用戶在使用手機(jī)銀行的時,可用“人臉+識別”替代手動輸入密碼。
3、目前正在對接的多家證券公司,都希望這個方案能夠用于遠(yuǎn)程開戶和安全支付,用戶不必再通過繁雜的人工校驗(yàn)審核,也不用擔(dān)心因?qū)徍诉^程的復(fù)雜而錯失一個投資良機(jī),對于使用者和企業(yè)來說都是比較高效的一個應(yīng)用方式。
除了在金融支付領(lǐng)域,在其他領(lǐng)域也在使用這種多生物特征融合認(rèn)證的解決方案,比如,科大訊飛目前在用的身份認(rèn)證考勤,全國各地的分公司只要在指定的地點(diǎn)進(jìn)行通過app進(jìn)行“人臉+聲紋”打卡即可。