雙目測(cè)距中基于三角形原理的視差與深度計(jì)算原理?(下)
視差圖的生成與遍歷計(jì)算
視差圖是一張與輸入圖像尺寸相同的灰度圖,其中每個(gè)像素的灰度值代表該位置的視差值。生成視差圖的過(guò)程本質(zhì)上是對(duì)左右兩幅圖像進(jìn)行像素級(jí)匹配的過(guò)程,而遍歷視差圖的每個(gè)點(diǎn)則是為了獲取場(chǎng)景中每個(gè)空間點(diǎn)的視差信息,進(jìn)而計(jì)算其深度。
視差圖的生成機(jī)制
視差圖的生成依賴于立體匹配算法,其核心任務(wù)是在右圖像中為左圖像的每個(gè)像素找到對(duì)應(yīng)的匹配點(diǎn)。常用的匹配算法包括基于區(qū)域的匹配(如塊匹配)、基于特征的匹配(如 SIFT 特征匹配)和基于深度學(xué)習(xí)的匹配(如 SGM、PSMNet 等)。
以塊匹配算法為例,其原理是:對(duì)于左圖像中某個(gè)像素 (x, y),在右圖像的同一行(y 坐標(biāo)相同)上劃定一個(gè)搜索范圍,通過(guò)計(jì)算像素塊的相似度(如 SSD、NCC 等度量)找到最佳匹配點(diǎn),該點(diǎn)與左圖像像素的水平距離即為視差 d。
遍歷視差圖的原理與意義
視差圖中的每個(gè)像素點(diǎn) (x, y) 對(duì)應(yīng)場(chǎng)景中三維點(diǎn) (x', y', Z),其中 Z 為深度信息。遍歷視差圖的過(guò)程,就是逐個(gè)提取每個(gè)像素的視差值 d (x, y),并代入深度公式 Z = B × f /d (x, y) 計(jì)算對(duì)應(yīng)點(diǎn)的深度。
這一過(guò)程的必要性在于:場(chǎng)景中不同物體的深度存在差異,同一物體表面也可能因姿態(tài)變化產(chǎn)生深度漸變。只有通過(guò)逐點(diǎn)遍歷,才能完整重建出場(chǎng)景的深度信息,形成稠密的深度圖。例如,在自動(dòng)駕駛場(chǎng)景中,路面、車輛、行人等不同目標(biāo)的深度差異顯著,遍歷視差圖可確保每個(gè)目標(biāo)的距離都被精準(zhǔn)計(jì)算。
關(guān)鍵技術(shù)細(xì)節(jié)與誤差控制
在實(shí)際應(yīng)用中,視差計(jì)算的精度直接影響深度測(cè)量的準(zhǔn)確性,而遍歷過(guò)程需要處理多種誤差來(lái)源:
系統(tǒng)標(biāo)定誤差:基線長(zhǎng)度 B 和焦距 f 的標(biāo)定誤差會(huì)直接傳遞到深度計(jì)算中。通過(guò)張氏標(biāo)定法等精確標(biāo)定方法,可將標(biāo)定誤差控制在 0.1% 以內(nèi)。
匹配歧義性:在紋理缺失區(qū)域(如白墻)、重復(fù)紋理區(qū)域(如棋盤(pán)格)或運(yùn)動(dòng)模糊區(qū)域,容易出現(xiàn)匹配錯(cuò)誤,導(dǎo)致視差圖中出現(xiàn)噪聲點(diǎn)。通過(guò)引入平滑約束(如左右一致性檢查)和后處理算法(如中值濾波),可有效剔除異常值。
視差范圍限制:由于攝像頭分辨率有限,視差的最大可能值由基線長(zhǎng)度和焦距決定。當(dāng)物體距離過(guò)遠(yuǎn)導(dǎo)致視差小于 1 像素時(shí),深度計(jì)算會(huì)出現(xiàn)較大誤差,此時(shí)需通過(guò)增大基線或使用長(zhǎng)焦鏡頭擴(kuò)展測(cè)量范圍。
畸變校正:攝像頭透鏡的徑向畸變和切向畸變會(huì)導(dǎo)致像點(diǎn)偏移,需在立體匹配前通過(guò)畸變模型(如 Brown 模型)進(jìn)行校正,確保左右圖像的像素在同一 epipolar 線上,減少匹配難度。
應(yīng)用場(chǎng)景與技術(shù)發(fā)展
基于視差圖遍歷的雙目測(cè)距技術(shù)已廣泛應(yīng)用于機(jī)器人導(dǎo)航、工業(yè)檢測(cè)、虛擬現(xiàn)實(shí)等領(lǐng)域。例如,在服務(wù)機(jī)器人中,通過(guò)實(shí)時(shí)遍歷視差圖,機(jī)器人可感知周圍環(huán)境的深度分布,實(shí)現(xiàn)避障和路徑規(guī)劃;在 3D 重建中,稠密視差圖為三維模型的構(gòu)建提供了精確的深度數(shù)據(jù)。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,視差圖的生成精度和效率不斷提升。端到端的立體匹配網(wǎng)絡(luò)(如 GCNet、RAFT-Stereo)通過(guò)學(xué)習(xí)圖像的上下文信息,能夠在復(fù)雜場(chǎng)景中生成更高質(zhì)量的視差圖,使遍歷計(jì)算得到的深度信息更接近真實(shí)值。同時(shí),硬件加速(如 FPGA、GPU)的應(yīng)用大幅提升了視差圖遍歷和深度計(jì)算的速度,滿足了實(shí)時(shí)性要求較高的場(chǎng)景(如自動(dòng)駕駛)。
總結(jié)
雙目測(cè)距中通過(guò)三角形原理計(jì)算深度的過(guò)程,本質(zhì)上是將二維圖像的視差信息轉(zhuǎn)化為三維深度信息的幾何映射。遍歷視差圖的每個(gè)點(diǎn),是將這一映射關(guān)系應(yīng)用于場(chǎng)景中每個(gè)空間點(diǎn)的必要步驟,其核心邏輯源于相似三角形的比例關(guān)系。隨著標(biāo)定技術(shù)、匹配算法和硬件性能的不斷進(jìn)步,基于視差的雙目測(cè)距技術(shù)在精度和魯棒性上持續(xù)提升,為計(jì)算機(jī)視覺(jué)感知三維世界提供了堅(jiān)實(shí)的技術(shù)支撐。