詳解Oculus Rift的主動(dòng)式光學(xué)定位技術(shù)
2016,VR元年,oculus、HTC、索尼等這樣的重量級(jí)廠商紛紛推出或宣布了自己的消費(fèi)級(jí)硬件產(chǎn)品來(lái)?yè)屨枷M(fèi)者市場(chǎng),相信廣大VR愛(ài)好者們中的很多人都已經(jīng)入手了一款虛擬現(xiàn)實(shí)設(shè)備。在這些硬件當(dāng)中,Oculus Rift CV1(以下簡(jiǎn)稱“CV1”)無(wú)疑是最受人矚目的硬件產(chǎn)品之一,畢竟它有2014年拿了Facebook20億美金這樣的大事件撐腰。
眾所周知,Oculus Rift采用的是主動(dòng)式光學(xué)定位技術(shù),那它到底是如何實(shí)現(xiàn)的呢?
(via:nukethefridge.com)
基本實(shí)現(xiàn)流程:
Oculus Rift設(shè)備上會(huì)隱藏著一些紅外燈(即為標(biāo)記點(diǎn)),這些紅外燈可以向外發(fā)射紅外光,并用紅外攝像機(jī)實(shí)時(shí)拍攝。獲得紅外圖像后,將攝像機(jī)采集到的圖像傳輸?shù)接?jì)算單元中,通過(guò)視覺(jué)算法過(guò)濾掉無(wú)用的信息,從而獲得紅外燈的所在方向,再利用PnP算法,即利用四個(gè)不共面的紅外燈在設(shè)備上的位置信息、四個(gè)點(diǎn)獲得的圖像信息即可最終將設(shè)備納入攝像頭坐標(biāo)系,擬合出設(shè)備的三維模型,并以此來(lái)實(shí)時(shí)監(jiān)控玩家的頭部、手部運(yùn)動(dòng)。
注:具體可看如下圖,注意上面這些紅色的小點(diǎn)點(diǎn)。
接下來(lái)我將向大家介紹一下我的推理過(guò)程,以及算法的一些細(xì)節(jié)。
| 頭顯上的LED燈
前文中我提到我們需要利用四個(gè)不共面的紅外燈在設(shè)備上的位置信息來(lái)進(jìn)行定位,而如果想要知道不同的紅外燈在設(shè)備上的位置信息,就必須能夠區(qū)分不同的紅外燈。
為什么這么說(shuō)呢,如果不區(qū)分紅外燈,那么當(dāng)DK2(注:特指頭顯)在空間中運(yùn)動(dòng)時(shí),攝像機(jī)捕捉到光點(diǎn)后,要進(jìn)行關(guān)聯(lián)(姿態(tài)最優(yōu)匹配的過(guò)程)的次數(shù) 會(huì)非常大,舉個(gè)列子:
1) 如果有N預(yù)測(cè)圖像點(diǎn)和M 《= N觀察圖像點(diǎn),則有N!/(N-M)!可能的關(guān)聯(lián)
2) 對(duì)于N = 40和M = 20(對(duì)DK2 LED的數(shù)量),有3.3&TImes;1029的關(guān)聯(lián),所以就算是計(jì)算機(jī),也無(wú)法快速地得到結(jié)果。
很顯然,DK2一定是采用了某種先驗(yàn)的方式區(qū)分光點(diǎn)。那么問(wèn)題來(lái)了,DK2到底是如何區(qū)分的呢?
我曾看到有文章中猜測(cè)說(shuō)DK2是通過(guò)LED燈的亮滅來(lái)區(qū)分的,實(shí)際上卻并非如此。因?yàn)殡m然通過(guò)LED燈的亮滅來(lái)區(qū)分比較簡(jiǎn)單,因?yàn)榱翜缱钊菀讌^(qū)分出來(lái),但是這種方法有個(gè)缺陷,就是無(wú)法區(qū)分是姿態(tài)改變導(dǎo)致的LED燈被遮擋,還是LED燈本身就熄滅了,所以,DK2沒(méi)有使用這個(gè)方法,而是采用LED燈光信息的強(qiáng)弱來(lái)實(shí)現(xiàn)的。我們來(lái)觀察用灰度攝像機(jī)拍攝的圖:
對(duì)比上面兩圖,可以發(fā)現(xiàn)亮斑的大小有變化。可以看出紅色部分,在圖2時(shí)光斑更大,藍(lán)色則相反。接下里我們看詳細(xì)的做法。這里必須說(shuō)一下,在推測(cè)具體的做法過(guò)程中,我曾誤以為DK2直接判斷光斑大小,然后根據(jù)多幀圖像的規(guī)律來(lái)判斷LED燈的ID,但實(shí)際上DK2是使用差分法來(lái)判斷光斑大小。我在這里簡(jiǎn)單給大家介紹一下我的推理過(guò)程。
首先我用自己的攝像機(jī)拍攝了大量照片進(jìn)行觀察后發(fā)現(xiàn)如果把攝像機(jī)用60HZ左右頻率拍攝,圖像每10張就會(huì)開(kāi)始重復(fù)。
我先給光點(diǎn)編個(gè)號(hào),如下圖:
比如,2號(hào)點(diǎn)的可以用肉眼識(shí)別的強(qiáng)弱順序:弱,弱,強(qiáng),強(qiáng),弱,強(qiáng),弱,弱,弱,強(qiáng)。
那么是不是這樣呢?如何在DK2中表示這些強(qiáng)弱關(guān)系呢?
首先,已知SDK的windows的driver會(huì)發(fā)送一個(gè)開(kāi)始信息,讓頭顯開(kāi)始運(yùn)作;
緊接著,這個(gè)driver就會(huì)不斷接收到下面信息:
X1 X2 X3 X4 是1個(gè)32位數(shù),是圖像分析后得到的空間坐標(biāo)(原理后面給大家解釋?zhuān)?,DX則不知道干什么用,但是觀察上面的num,換算出來(lái)是40,index從1開(kāi)始,不斷遞增到40,說(shuō)明DK2在一個(gè)一個(gè)的識(shí)別LED燈,另外,這些信息每17ms左右發(fā)上來(lái)一次,和60HZ的拍攝頻率差不多,基本上可以認(rèn)定是利用每10幀確定一個(gè)LED的方式。
為了完全確定這一點(diǎn),還必須確定另一個(gè)問(wèn)題:同步。
如果真的是LED通過(guò)10幀不同的變化來(lái)讓攝像機(jī)確定LED燈的ID,那么必須要同步。
這要求一個(gè)同步信號(hào)能同時(shí)傳給攝像機(jī)和頭顯,如果能了解同步的時(shí)機(jī),就知道到底是不是60HZ的頻率了。
可是當(dāng)我看了MT9V034的資料后發(fā)現(xiàn)居然拍攝的頻率是30HZ左右,不過(guò)細(xì)想一下,如果使用差分檢測(cè)發(fā),使用30HZ這個(gè)頻率也能拍攝出光強(qiáng)的變化。也就是說(shuō),DK2根本不是直接判斷光斑是大還是小,而是將當(dāng)前幀的光斑與上一幀同一個(gè)光斑做對(duì)比,如果比之前大,則為大,反之則為小。那么當(dāng)一個(gè)新的幀到達(dá)時(shí),該算法首先提取幀的亮像素斑點(diǎn),如下圖。忽略少于10個(gè)像素或不是圓盤(pán)狀的,最后確保所有的斑點(diǎn)來(lái)自前一幀中提取的大圓盤(pán)狀斑點(diǎn),然后進(jìn)行對(duì)比。
所以,DK2將當(dāng)前幀的光斑與上一幀同一個(gè)光斑做對(duì)比,然后根據(jù)10幀不同的變化來(lái)讓攝像機(jī)確定LED燈的ID。
我在進(jìn)一步查看這些點(diǎn)和位置信息的對(duì)應(yīng)關(guān)系后,總結(jié)出DK2判斷強(qiáng)弱變化的依據(jù)是:
1) 如果當(dāng)前幀的斑點(diǎn)比上一幀斑點(diǎn)大10%,就是0;
2) 如果當(dāng)前幀的斑點(diǎn)比上一幀斑點(diǎn)小10%,就是1;
3) 否則忽略。
這樣的設(shè)計(jì)非常好,防止了LED燈受到隨機(jī)干擾。