人臉識別技術(shù)在軌道交通閘機口人物身份判定報警應(yīng)用探索
引 言
隨著我國平安城市建設(shè)的推進,對城市治安防控的技術(shù)支撐要求也越來越高,傳統(tǒng)的技術(shù)手段越來越難以高效解決日益增長的人員流動安全防控問題。城市地鐵作為一類特殊的封閉交通環(huán)境,是需要更高級別安全監(jiān)控的場所。因此,相比于一般公共場所需要提供更高級別的安全防范技術(shù)手段和措施。
人臉識別技術(shù)作為生物識別技術(shù)的一種,目前已在我國公安系統(tǒng)的戶籍和治安等業(yè)務(wù)管理中得到應(yīng)用,并取得了很好的效果。這類應(yīng)用主要是在基于靜態(tài)的證件照、正面標準照的基礎(chǔ)上,比對照片與數(shù)據(jù)庫照片來判別身份,其應(yīng)用環(huán)境質(zhì)量較好。在城市軌道交通閘機動態(tài)場景下,針對過往行人無序走動過程中,能夠把實時采集的人臉數(shù)據(jù)與照片庫進行比對, 原有的基于靜態(tài)比對方法及技術(shù)手段已無法達到實際管理效果和要求。因此,探索軌道交通動態(tài)環(huán)境下人臉識別技術(shù)應(yīng)用研究具有重要的社會價值和現(xiàn)實意義。
1 動態(tài)人臉識別技術(shù)基本原理
動態(tài)人臉識別技術(shù)包括人臉數(shù)據(jù)采集和比對兩個主要技術(shù)環(huán)節(jié)。人臉照片數(shù)據(jù)采集的質(zhì)量越好,比對的準確率就越高。目前人臉采集主要有抽幀截圖法與人物軌跡法兩種。
抽幀截圖法采用人臉抓拍攝像頭抽幀或從視頻流里直接抽幀,是把單幀作為獨立照片進行處理的方法,每張照片提取的特征碼都具有人臉的部分特征。
人物軌跡法是根據(jù)視頻流中人的行走軌跡圖像的漸變來判斷人物身份,并從中截取多張質(zhì)量較好的照片進行分析處理, 提取當前過往行人面部多個細節(jié)的特征碼,進而提高比對的準確率。
從目前的實際應(yīng)用來看,在這兩種方法中,依據(jù)人物軌跡法獲得的照片及特征碼要優(yōu)于抽幀截圖法獲得的照片及特征碼,其比對質(zhì)量和準確率更高。
2 環(huán)境場景中攝像頭選型及架設(shè)要求
根據(jù)常規(guī)視頻流的人臉采集方法,需選擇有 200 萬像素以上的高清攝像頭,能夠支持RTSP 視頻流輸出,同時需要為人臉采集應(yīng)用提供單獨一路碼流,其網(wǎng)絡(luò)帶寬占用為 6 Mb/s, 網(wǎng)絡(luò)前后端需要設(shè)固定的IP 地址。為提高已有裝備設(shè)備的利用率,技術(shù)選型要盡量采用能夠支持多攝像頭廠商設(shè)備的人臉識別技術(shù)。
鏡頭選擇依據(jù)架設(shè)攝像頭與被拍照人員閘口的距離決定, 理論上講,距離越遠,越需要中長焦攝像頭,相應(yīng)攝像頭的架設(shè)高度也應(yīng)進行適當調(diào)整。一般情況下,攝像頭架設(shè)高度應(yīng)控制在 2.5 ~2.9 m 之間。攝像頭架設(shè)示意圖如圖 1 所示。
圖 1 攝像頭架設(shè)示意圖
攝像頭架設(shè)位置應(yīng)盡可能正對閘機出入口,使出閘機人員面部處在視頻橫向圖像的左五分之一到右五分之一之間,使人流走向盡量朝向攝像頭。如有覆蓋不足的個別區(qū)域,可適當傾斜攝像頭角度,調(diào)整相應(yīng)姿態(tài)以獲取較好的圖像質(zhì)量。
3 環(huán)境場景中服務(wù)器的基本要求
根據(jù)通道人流量的情況,經(jīng)測試,目前一般單臺參數(shù)為E5-2650V3 2/64G 的服務(wù)器可以支持不超過 4 路攝像頭的人像采集與比對計算要求。當人流量較大時,因會增加服務(wù)器計算資源需求量,一般要采取適當減少攝像頭接入路數(shù)等方式予以解決。
隨著硬件 GPU 技術(shù)的不斷進步更新,設(shè)備制造成本降低, 隨著廠商人臉識別算法對 GPU 的不斷支持與優(yōu)化,預(yù)計未來可以實現(xiàn)單臺GPU 服務(wù)器支持超過 20 路以上的視頻接入。
4 用于比對的基礎(chǔ)報警庫準備
報警庫就是為采集每張照片在入庫提取特征碼后,提供實時比對的人臉照片數(shù)據(jù)庫。理論上講,基礎(chǔ)報警庫越小, 其報警準確率越高;反之,基礎(chǔ)報警庫越大,其誤報率也就越高。目前,我們在寧波交通軌道實際應(yīng)用場景中,采用的是 6 萬張基礎(chǔ)報警庫。從寧波全市目前每天軌道交通客流 30 萬
人次的實際應(yīng)用來看,每日比對次數(shù)約為 180 億次。如果是特大城市,對人臉動態(tài)識別技術(shù)和處理能力的要求會更高。
5 動態(tài)人臉識別技術(shù)應(yīng)用的幾個重要參數(shù)
5.1 人臉抓拍率
人臉抓拍率即在實際場景中實時采集到的人臉數(shù)量與實際過往人數(shù)總數(shù)的比值。人臉抓拍率越高,表明對視頻中過往行人情況采集的能力越強,其數(shù)量指標也就越好。較高的人臉抓拍率需要較高的服務(wù)器計算資源,因此,在實際人流量較大的區(qū)域,應(yīng)適當增加服務(wù)器數(shù)量或提供更高配置的服務(wù)器資源。
5.2 報警閾值
報警閾值需提前設(shè)置,且應(yīng)依據(jù)不同場景、不同警力配備進行設(shè)置。如在安保要求較高、警員人力充沛的大型活動中,可設(shè)置較低的報警閾值,盡量避免漏報,可對因增多的誤報有充足的警力進行人工排查;對一般普通場景,在警力配備不多的情況下,可以設(shè)置較高的報警閾值,盡量避免誤報,允許適當漏報。
5.3 漏報率
漏報率即應(yīng)報警而未報警的人數(shù)與應(yīng)報警總?cè)藬?shù)的比值。在不同動態(tài)人臉識別算法中,應(yīng)盡量選擇漏報率較低的算法; 在相同動態(tài)人臉識別算法情況下,因漏報率與誤報率密切相關(guān), 因此要依據(jù)不同的場景進行合理選擇。
5.4 誤報率
誤報率即報警錯誤的人數(shù)與實際報警總?cè)藬?shù)的比值。由于漏報率降低會造成誤報率上升。因此在實際工作中,需要在系統(tǒng)運行一段時間后,依據(jù)警力情況將誤報率、漏報率設(shè)置在一個穩(wěn)定的區(qū)域。
6 軌道交通應(yīng)用中選型測試及方法
6.1 點測試不同廠商動態(tài)人臉識別系統(tǒng)的報警準確值
報警準確值是決定能否真實判斷一個目標人員身份的重要指標,只有比對成功有效,才能夠產(chǎn)生實際應(yīng)用效果。從我們的實踐來看,在考察報警準確值階段,要盡可能投入充足的警力,對系統(tǒng)報警的信息進行逐一核對確認,基于上述數(shù)據(jù)形成統(tǒng)計分析報告,可以對不同廠商提供的人臉識別技術(shù)系統(tǒng)進行分析對比。
6.2 全面判斷動態(tài)人臉識別系統(tǒng)漏報率與誤報率的均衡性
在實際應(yīng)用過程中,漏報率和誤報率必須要達到一定程度的均衡才有實際意義。均衡的標準是在報警準確值達標的情況下,盡可能減少一線警員的排查工作量,同時還能獲得較好的應(yīng)用效果。均衡性考察的目的是使一線警員有余力兼顧處理其他工作,不會過多占用警力在大量的排查工作中。
6.3 優(yōu)先選擇原創(chuàng)算法廠商的動態(tài)人臉識別系統(tǒng)
目前,人臉識別技術(shù)在人工智能的引領(lǐng)下快速發(fā)展,國內(nèi)能夠提供動態(tài)人臉識別相關(guān)解決方案的公司也越來越多。但就人臉識別技術(shù)本身而言,總體還處于初始階段,還有較長的發(fā)展進程。因此,在技術(shù)使用早期階段,相當長的一段時間內(nèi)還會存在對人臉識別算法不斷迭代、優(yōu)化升級的問題, 所以選擇擁有原創(chuàng)算法的廠商會有較好的可靠性,能夠針對軌道交通治安監(jiān)控實際,做出更有針對性的技術(shù)改進,有利于優(yōu)化實景應(yīng)用效果。
7 結(jié) 語
隨著基于深度學(xué)習(xí)的人工智能發(fā)展,人臉識別技術(shù)在近兩年獲得了突飛猛進的發(fā)展,尤其在公安應(yīng)用業(yè)務(wù)中,取得了顯著的成績,并顯現(xiàn)出了巨大的應(yīng)用前景。在基層實際應(yīng)用工作中,要依據(jù)不同的應(yīng)用場景和應(yīng)用條件,選擇合理的人臉識別應(yīng)用技術(shù),向科技要警力,不斷提升城市治安管控的科技水平,彰顯信息技術(shù)的巨大作用。