一種基于服務(wù)機器人的視覺系統(tǒng)設(shè)計
劉京誠,廖智勇,朱木健 摘 要:通過采用圖像傳感器ov7635采集圖像,幀存儲器al422b進行數(shù)據(jù)緩存,cpld控制時序,dsp進行圖像處理,構(gòu)建了一個圖像采集的硬件系統(tǒng)。在圖像軟件處理中,采用閾值向量判斷法和改進的種子填充法來完成彩色圖像的識別和分割,在分割中計算圖像的幾何矩,利用全局圖像的幾何矩特征量構(gòu)建圖像雅可比矩陣,并用推導(dǎo)的圖像雅可比矩陣完成一個圖像反饋與目標運動自適應(yīng)補償?shù)囊曈X跟蹤系統(tǒng)。系統(tǒng)采用了tft液晶來直觀顯示視覺識別和跟蹤的效果。 關(guān)鍵詞:視覺系統(tǒng);閾值向量;種子填充;圖像矩;雅可比矩陣 隨著計算機科學(xué)和自動控制技術(shù)的發(fā)展,越來越多的不同種類的智能機器人出現(xiàn)在工廠、生活當(dāng)中,機器人視覺系統(tǒng)作為智能機器人系統(tǒng)中一個重要的子系統(tǒng),也越來越受到人們的重視。它涉及了圖像處理、模式識別和視覺跟蹤等領(lǐng)域。不同種類的機器人由于工作的重點不一樣,它的視覺系統(tǒng)在軟件或硬件上都有著細微的差別。本文研究基于服務(wù)機器人的單目視覺系統(tǒng)。它處理的是二維圖像,是基于對無遮擋物體顏色和形狀的識別以及3d目標物體的平動跟蹤?! ∫曈X系統(tǒng)是一個非常復(fù)雜的系統(tǒng),它既要做到圖像的準確采集還要做到對外界變化反應(yīng)的實時性,同時還需要對外界運動的目標實時跟蹤。因此,視覺系統(tǒng)對硬件和軟件系統(tǒng)都提出了較高的要求。目前比較流行的足球機器人技術(shù),它的視覺系統(tǒng)屬于比較典型的快速識別和反應(yīng)類型。一般情況下,它是通過彩色標志定標的方法來達到對隊員和目標的識別,以及通過擴展卡爾曼濾波器的預(yù)測功能來實現(xiàn)對目標的跟蹤功能。在硬件上,采用一個現(xiàn)成的攝像機來實現(xiàn)一個機器人的圖像采集系統(tǒng)?! ”鞠到y(tǒng)在設(shè)計上采用cmos圖像傳感器代替ccd類型傳感器進行采集圖像,dsp處理芯片tms320vc5509a進行圖像處理以及作為cpu控制,在設(shè)計過程中,為了直觀顯現(xiàn)機器人視覺系統(tǒng)識別和跟蹤的效果,專門采用了一個tft格式的液晶來直觀顯示。軟件上,采用了一部分足球機器人的視覺技術(shù)來達到對目標的快速識別,通過全局的特征矩構(gòu)建的雅可比矩陣達到對目標的自適應(yīng)跟蹤。1 硬件部分設(shè)計 圖1為系統(tǒng)硬件電路的功能模塊框圖。1.1 圖像采集 視覺鏡頭把外部的圖像信息成像在圖像傳感器的面陣單元上。目前流行的圖像傳感器有面陣ccd(charged coupled device,電荷耦合器件)型和面陣cmos兩種。相比較ccd型的圖像傳感器,cmos圖像傳感器的有源像素單元為每一個像素提供了放大器,只需一個單供電低邏輯電平電壓,功耗只相當(dāng)于ccd的十分之一。cmos圖像傳感器內(nèi)部集成了a/d轉(zhuǎn)換部分,直接輸出數(shù)字信號?;谶@些因素,本系統(tǒng)采用了omnivision公司推出的cmos彩色圖像傳感器ov7635?! v7635的分辨力為640x480,能輸出3種格式的8位數(shù)據(jù):ycbcr4:2:2模式、rgb4:2:2模式和rgb原始數(shù)據(jù)模式。輸出vga格式最大可達到30fps(fps:每秒幀數(shù))。能工作在逐行掃描下和隔行掃描下。ov7635有主模式和從模式兩種工作模式。在主模式下,同步信號和時鐘不由外圍設(shè)備控制。在從模式下,ov7635的場同步信號vsync,行同步信號href以及系統(tǒng)的晶振頻率xclk均由外部設(shè)備控制。本系統(tǒng)采用的是主模式。ov7635通過i2c總線配置片內(nèi)寄存器,使其輸出原始數(shù)據(jù)。系統(tǒng)上電復(fù)位后,由dsp芯片的i2c總線信號對cmos寄存器初始化。然后ov7635就按要求輸出圖像信號。包括行同步信號href,場同步信號vsync,像素時鐘信號pclk,數(shù)字圖像信號。1.2 液晶顯示 為了很直觀的看到視覺系統(tǒng)對人的識別和跟蹤效果,采用了一片innolux公司的pt035tn01液晶顯示屏。為了不增加對dsp的負擔(dān),同時也為了實時看到對外界目標物體的跟蹤效果,液晶顯示的數(shù)據(jù)不經(jīng)由dsp,直接通過傳感器ov7635輸出的圖像數(shù)據(jù)信號和cpld控制時序來進行顯示。pt035tn01是3.5英寸tft格式的液晶,分辨力為320×3(rgb)×240,液晶if1、if2兩輸入控制腳對輸入的數(shù)據(jù)格式進行選擇:串行rgb格式、ccir601格式、ccir656格式。液晶的掃描模式有4種。本視覺系統(tǒng)采用的輸入數(shù)據(jù)格式是ccir601格式,掃描模式為由上到下和左到右的掃描模式?! ≡赾cir601格式下,圖像傳感器輸出的像素時鐘pclk通過cpld二分頻作為液晶的工作時鐘,圖像傳感器輸出的行同步信號href經(jīng)過cp