基于DCT域的公路車牌定位算法
1 引 言
車輛牌照識(shí)別( VLPR: V ehic le L icense PlateRecognit iON)系統(tǒng)作為一個(gè)專用的計(jì)算機(jī)視覺系統(tǒng),能夠自動(dòng)攝取車輛圖像并識(shí)別出車牌。這個(gè)系統(tǒng)可應(yīng)用在公路自動(dòng)收費(fèi)、停車場管理、失竊車輛偵察、門衛(wèi)系統(tǒng)、智能交通系統(tǒng)等不同場合。汽車牌照定位是車牌識(shí)別的難點(diǎn), 因此, 公路車牌定位算法的研究有著重要而實(shí)用意義。車牌識(shí)別在圖像處理技術(shù)中是典型的先分割目標(biāo)進(jìn)而識(shí)別的應(yīng)用實(shí)例。類似的應(yīng)用包括信封上郵政編碼的分割與識(shí)別、貨運(yùn)列車車型車號(hào)的自動(dòng)分割和識(shí)別、文字的識(shí)別等等。雖然車輛牌照識(shí)別系統(tǒng)是一個(gè)針對(duì)車牌識(shí)別的專用系統(tǒng), 然而對(duì)它的研究定會(huì)對(duì)上述類似問題的研究起到推動(dòng)作用。
關(guān)于車牌定位已有很多方法提出, 如基于數(shù)學(xué)形態(tài)學(xué)的定位方法:基于顏色的定位方法 , 這種方法主要利用彩色空間的信息, 實(shí)現(xiàn)車牌定位, 包括彩色邊緣算法、顏色距離、相似度算法和基于邊緣的顏色對(duì)方法等; 基于遺傳算法提取汽車牌照的方法:基于神經(jīng)網(wǎng)絡(luò)的車牌定位方法。
針對(duì)各種車牌定位算法的優(yōu)缺點(diǎn), 提出基于DCT變化的車牌定位算法, 該方法在DCT 數(shù)據(jù)中,提取出一種基于加權(quán)頻率的車牌區(qū)新特征, 然后經(jīng)過自適應(yīng)閾值分類, 采用基于投影法的車牌區(qū)分割方法, 直接在DCT 域?qū)崿F(xiàn)車牌的快速定位。該方法可使定位矩形框緊湊地包圍車牌區(qū)域, 有效降低誤檢率, 且運(yùn)算復(fù)雜度較低, 有利于實(shí)現(xiàn)復(fù)雜背景中車牌的快速定位。
2 車牌定位算法
2. 1 離散余弦變換
離散余弦變換( DCT )是利用傅立葉變換的對(duì)稱性, 采用圖像邊界褶翻操作將圖像變換為偶函數(shù)形式, 然后對(duì)這樣的圖像進(jìn)行二維離散傅立葉變換, 變換后的結(jié)果將僅包含余弦項(xiàng), 故稱之為離散余弦變換。DCT可以將圖像描述為不同幅值和頻率的正弦值之和的形式。對(duì)于一幅典型的圖像, DCT 有這樣的性質(zhì): 許多有關(guān)圖像的重要可視信息都集中在DCT變換的一小部分系數(shù)中。
一個(gè)M N矩陣A 的二維DCT定義如下:
數(shù)值Bpq稱為A 的DCT系數(shù)。DCT是一個(gè)可逆變換, 逆變換的定義如下:
DCT逆變換方程可以理解為: 任意M N 的矩陣A 都可以寫成M N 個(gè)如公式( 3)所示的函數(shù)之和的形式:
這些函數(shù)被稱為DCT基本函數(shù)。
2. 2 基于DCT 域的特征提取
對(duì)于彩色圖像, 圖像預(yù)處理部分首先將輸入的圖像去掉彩色, 進(jìn)行灰度化。利用RGB 空間到灰度的轉(zhuǎn)換公式得到車牌的灰度圖像, 即:
其中, f ( x, y )為( x, y )位置像素的灰度值, R ( x,y )、G (x, y )、B ( x, y )為輸入彩色圖像在( x, y )位置像素的紅、綠、藍(lán)顏色對(duì)應(yīng)的彩色信息。
預(yù)處理后的圖像經(jīng)DCT 變換后所得到的系數(shù)位置及其幅值所反映的是該變換圖像的空間頻率及其能量。這里, 將圖像劃分為子塊, 子塊的大小為8 8, 對(duì)每個(gè)8 8的子塊進(jìn)行DCT 變換使其能量按頻率集中, 得到的64個(gè)變換系數(shù), 分別代表對(duì)應(yīng)不同基波頻率分量的大小。
若將8 8的DCT系數(shù)劃分為0區(qū)、1區(qū)、2區(qū)、3區(qū)等4個(gè)區(qū)域, 則每個(gè)區(qū)域代表不同紋理的方向:0區(qū)表示的是直流分量(即8 8子塊的平均值) , 1區(qū)表示的是豎向紋理(即水平方向的頻率變化), 2區(qū)表示的是斜向紋理(即斜向的頻率變化) , 3區(qū)表示的是橫向紋理(即豎直方向的頻率變化)。
由于車牌字符區(qū)域具有特殊的線條結(jié)構(gòu), 它基本上可歸為橫向、豎向、斜向的線條組合。在圖像中, 這些線條主要顯示出特殊的紋理特點(diǎn), 其灰度與背景相差較大, 即邊緣變化較劇烈, 且表現(xiàn)出明顯的豎向、斜向、橫向紋理特征。而在DCT 域中則主要表現(xiàn)為在圖的1、2、3區(qū)的中高頻部分的系數(shù)值較大, 即豎向線條的變換系數(shù)主要集中于1區(qū), 斜向線條的變換系數(shù)主要集中于2區(qū)( 1區(qū)與3區(qū)也有一定的分布) , 橫向線條的變換系數(shù)主要集中于3區(qū),這是圖像所含車牌字符在DCT 域中所表現(xiàn)出的紋理特征??梢?, 車牌字符區(qū)所具有的特殊結(jié)構(gòu)使其在DCT 域能夠表現(xiàn)出更為豐富的中、高頻DCT 分量。同時(shí), 車牌字符區(qū)在DCT域表現(xiàn)出明顯的方向性信息。綜合考慮上述兩點(diǎn), 用一種基于DCT子塊的加權(quán)頻率特征(W eighted Frequency, WF) , 通過對(duì)不同方向DCT 分量進(jìn)行非線性加權(quán)增強(qiáng), 如公式( 5)所示, 從而使車牌字符區(qū)特征更加明顯。
其中c( i, j)為8 8塊中第i行第j列的DCT系數(shù); i取1~ 8; j取1~ 8, 圖1為輸入車輛圖像及其對(duì)應(yīng)的WF 特征圖??梢姡?車牌字符區(qū)域的WF 值明顯高于背景。
圖1 輸入圖像及其WF特征圖。
2. 3 分類處理
在進(jìn)行分類時(shí), 如果圖像中車牌和背景之間的對(duì)比度較低, 此時(shí)的WF 值會(huì)比較小; 另外, 高頻信息豐富的非車牌區(qū)域背景經(jīng)常也具有較大的WF值。因此, 如果采用固定閾值, 則不利于低對(duì)比度車牌區(qū)域的提取, 同時(shí)也容易將高頻豐富的背景誤認(rèn)為車牌區(qū)域。因此本算法采用自適應(yīng)閾值法進(jìn)行分類, 閾值的設(shè)定如公式( 6)所示。
其中aver為整幅圖像的平均WF 值, max 為整幅圖像的最大WF值, m in為整幅圖像的最小WF值, k為經(jīng)驗(yàn)值, 可按公式( 7)進(jìn)行分類。
圖2為分類結(jié)果圖, 可以看出, 大量的背景被去除, 車牌區(qū)被很好地提取出來。
圖2 分類結(jié)果圖。
2. 4 平滑去噪
分類后的二值標(biāo)記圖中, 通常會(huì)存在一些零散的噪聲點(diǎn), 而真實(shí)車牌區(qū)域只有一個(gè), 過多的噪聲點(diǎn)往往會(huì)干擾車牌區(qū)域的投影, 引起定位框比實(shí)際車牌區(qū)域大, 或者制造假車牌區(qū)。因此, 在分割之前,需要對(duì)分類結(jié)果圖進(jìn)行平滑去噪。通常的噪聲是一些物體邊緣或紋理較豐富的背景, 形狀大多不規(guī)則且分布較稀疏, 用統(tǒng)計(jì)濾波法, 可減小其影響, 具體方法為: 統(tǒng)計(jì)每個(gè)候選區(qū)域中的像素點(diǎn)數(shù), 并找出最大的像素點(diǎn)數(shù), 當(dāng)候選區(qū)域的像素點(diǎn)數(shù)小于一定值時(shí)(本算法中使用候選區(qū)域最大像素點(diǎn)數(shù)的1 /4) ,即認(rèn)為該區(qū)域?yàn)樵肼晠^(qū)域, 將其去除。
對(duì)于候選車牌區(qū)中可能會(huì)有的少量凹區(qū)和斷續(xù), 可以通過游程平滑算法進(jìn)行平滑。所謂游程平滑算法是對(duì)同一掃描行上的黑像素點(diǎn)之間的距離進(jìn)行檢測, 當(dāng)兩相鄰黑像素點(diǎn)之間的空白游程長度小于門限值時(shí), 則將這兩點(diǎn)之間的空白游程全部填黑。
考慮到一條水平掃描線上的一段游程L = (P 1, P 2,……, P i, Pi+ 1,……,P j- 1, P j, ……, Pn ); 其中游程L1 =(P1, P2, ……, P i )和L 3 = (Pj , ……, P n )是0- 游程(即黑像素游程), 而L 2 = (Pi+ 1, ……, Pj- 1 )是1 - 游程(即白像素游程)。當(dāng)L2 的長度j- i- 1小于設(shè)定的門限T 時(shí), 則將兩黑游程L1 和L3 連接起來即把游程L2 的全部像素平滑成黑。在本算法中游程平滑算法運(yùn)用了兩次, 即水平方向和垂直方向各用一次。
處理后的圖像如圖3所示。
圖3 平滑去噪處理后。
2. 5 投影分割
經(jīng)過上述操作后, 某個(gè)區(qū)域內(nèi)一定會(huì)包含實(shí)際的車牌, 為精確定位車牌, 采用投影法分割, 快速定位圖像中的車牌區(qū)域, 并且誤檢率較低。
對(duì)于去噪后的標(biāo)記圖, 首先對(duì)其進(jìn)行水平投影,然后對(duì)投影值進(jìn)行分析, 確定出水平基線, 再在水平基線之間進(jìn)行垂直投影, 確定出垂直基線。這樣就可以初步定位出車牌區(qū)。基線的產(chǎn)生依據(jù)下面的規(guī)則: 首先設(shè)定一個(gè)閾值T, 將小于此閾值的投影值置0, 大于此閾值的投影值置1, 然后當(dāng)相鄰?fù)队爸狄粋€(gè)為0, 另一個(gè)為1時(shí), 即認(rèn)為非零投影值處存在一條基線。在本算法中進(jìn)行了兩次投影, 即水平和垂直投影。確定出水平基線和垂直基線后即可在圖像中劃出矩形框, 標(biāo)出車牌區(qū)域。另外, 為使矩形框緊緊包圍車牌區(qū)域, 在畫基線之前, 首先判斷矩形框各基線上所有像素值之和是否為零, 若為零, 則將基線向靠近矩形中心的位置移動(dòng)直到各基線上所有像素值之和不為零為止。算法的最終定位結(jié)果圖如圖4所示。
圖4 定位結(jié)果圖。
3 結(jié)束語
本算法通過對(duì)汽車圖像進(jìn)行離散余弦變換( DCT ), 得到DCT 系數(shù), 并計(jì)算加權(quán)頻率特征, 之后采用自適應(yīng)閾值法, 實(shí)現(xiàn)車牌區(qū)/非車牌區(qū)的快速分類; 再經(jīng)平滑濾波之后, 利用投影法實(shí)現(xiàn)車牌區(qū)域的定位, 有效降低誤檢率, 且運(yùn)算復(fù)雜度較低, 有利于實(shí)現(xiàn)復(fù)雜背景中車牌區(qū)域的快速定位。經(jīng)多次實(shí)驗(yàn)證明, 本算法具有較高的正確檢測率, 部分實(shí)驗(yàn)結(jié)果如圖5所示。