關(guān)于ARM的PC指針異常返回處理(PC+8,PC+4,PC-4,PC-8情況)
要理解PC指針,首先就要好好了解LR指針
連接寄存器LR(r14):用來保存和恢復(fù)PC寄存器的內(nèi)容,它有兩個特殊功能。
??? (1)保存子程序返回地址。使用BL或BLX時,跳轉(zhuǎn)指令自動把返回地址放入r14中;子程序通過把r14復(fù)制到PC來實現(xiàn)返回,通常用下列指令之一:
??????????????????????? MOV PC, LR?
??????????????????????? BX LR
???????????? 通常子程序這樣寫,保證了子程序中還可以調(diào)用子程序。
???????????????????????? stmfd sp!, {lr}
???????????????????????? ……
???????????????????????? ldmfd sp!, {pc}
??? (2)當(dāng)異常發(fā)生時,異常模式的r14用來保存異常返回地址,將r14如棧可以處理嵌套中斷。
程序計數(shù)器r15(PC):PC是有讀寫限制的。當(dāng)沒有超過讀取限制的時候,讀取的值是指令的地址加上8個字節(jié),由于ARM指令總是以字對齊的,故bit[1:0]總是00。當(dāng)用str或stm存儲PC的時候,偏移量有可能是8或12等其它值。在V3及以下版本中,寫入bit[1:0]的值將被忽略,而在V4及以上版本寫入r15的bit[1:0]必須為00,否則后果不可預(yù)測。
知道PC寄存器和LR寄存器功能以后,再了解一下ARM處理器的三級流水線和多級流水線
從圖中可以看出,一條匯編指令的運(yùn)行有三個步驟,取指、譯碼、執(zhí)行,當(dāng)?shù)谝粭l匯編指令取指完成后,緊接著就是第二條指令的取指,然后第三條...如此嵌套
其實很容易看出,第一條指令:
add r0, r1,#5
取指完成后,PC就指向了第二條指令,此時PC=PC+4
當(dāng)?shù)谝粭l指令譯碼完成以后,此時PC=PC+8
所以第一條指令開始執(zhí)行時,PC值已經(jīng)加了8
所以必須記住這個前提,在arm中,每次該指令執(zhí)行時,其實這時的PC值是PC=PC+8
由于此處不是本文重點(diǎn),更多關(guān)于多級流水線和PC為什么是PC+8的詳細(xì)內(nèi)容,點(diǎn)此跳轉(zhuǎn)。
接下來談?wù)勎覀冊赼rm匯編時,什么時候需要PC-4, PC-8, PC什么都不減
!記?。篜C不是指向你正在運(yùn)行的指令,而是PC始終指向你要取指的指令的地址
我們以下面uboot中的start.S的最開始的匯編代碼為例來進(jìn)行解釋:
00000000: ???0: ea000014? b 584: e59ff014? ldr pc,?[pc,?#20] ;?208: e59ff014? ldr pc,?[pc,?#20] ;?24c: e59ff014? ldr pc,?[pc,?#20] ;?2810: e59ff014? ldr pc,?[pc,?#20] ;?2c14: e59ff014? ldr pc,?[pc,?#20] ;?3018: e59ff014? ldr pc,?[pc,?#20] ;?341c: e59ff014? ldr pc,?[pc,?#20] ;?3800000020: ??20: 00000120? .word 0x00000120
流水線如表格:
指令物理地址Cycle1Cycle2Cycle3Cycle4Cycle5Cycle60??????4取指譯碼執(zhí)行???8?取指譯碼執(zhí)行??c??取指譯碼執(zhí)行?10???取指譯碼執(zhí)行14????取指譯碼18?????取指
紅色加粗字體代表:實際PC的物理地址(即PC始終指向你要取的指令的地址)
指令周期Cycle1取指
PC總是指向?qū)⒁x取的指令的地址(即我們常說的,指向下一條指令的地址),而當(dāng)前PC=4,
所以去取物理地址為4對對應(yīng)的指令
ldr pc,?[pc,?#20]
其對應(yīng)二進(jìn)制代碼為e59ff014。
此處取指完之后,自動更新PC的值,即PC=PC+4(單個指令占4字節(jié),所以加4)=4+4=8
指令周期Cycle2譯指
翻譯地址為4的指令e59ff014
同時再去取指
PC總是指向?qū)⒁x取的指令的地址(即我們常說的,指向下一條指令的地址),而當(dāng)前PC=8,
所以去物理地址為8所對應(yīng)的指令“l(fā)dr pc, [pc, #20]” 其對應(yīng)二進(jìn)制代碼為e59ff014。
此處取指完之后,自動更新PC的值,即PC=PC+4=8+4=12=0xc
指令周期Cycle3執(zhí)行(指令)
執(zhí)行“e59ff014”,即
ldr pc,?[pc,?#20]
所對表達(dá)的含義,即PC
= PC + 20
= 12 + 20
= 32
= 0x20
此處,只是計算出待會要賦值給PC的值是0x20,這個0x20還只是放在執(zhí)行單元中內(nèi)部的緩沖中。
譯指
翻譯地址為8的指令e59ff014
取指
此步驟由于是和上面a.中的執(zhí)行同步做的,所以,未受到影響,繼續(xù)取指,而取指的那一時刻,PC為上一Cycle更新后的值,即PC=0xc,所以是去取物理地址為0xc所對應(yīng)的指令
ldr pc,?[pc,?#20]
對應(yīng)二進(jìn)制為e59ff014 ? 此處取指完之后,自動更新PC的值,即PC=PC+4=0xc+4=0x10
用圖來總結(jié)過程:
再記?。焊淖働C的值,會導(dǎo)致流水線清空?。。?/p>
好了,那我們繼續(xù)來看什么時候需要PC-4, PC-8, PC什么都不減
這個取決于是在正常程序的跳轉(zhuǎn)還是發(fā)生異常:
我先假設(shè)當(dāng)前運(yùn)行上面地址4所對應(yīng)的指令,將它稱作第一條指令!
------------------------------------------------------------------------------------------------------------------------------------------------------------
正常跳轉(zhuǎn):
如果是使用BL執(zhí)行了正常程序的跳轉(zhuǎn),那么執(zhí)行這條BL指令時,由于是正常的跳轉(zhuǎn)指令,所以cpu會將下一句的物理地址存放在LR中,那么將8地址存放在LR中),當(dāng)從子程序跳轉(zhuǎn)回來的時候,那么就需要將保存在LR寄存器中的值恢復(fù)給PC寄存器,mov PC, LR ??? 這樣的指令返回
------------------------------------------------------------------------------------------------------------------------------------------------------------
異常跳轉(zhuǎn):
當(dāng)前執(zhí)行的是地址4對應(yīng)的第一條指令,
在分別講解各種異常之前,有一條總的原則就是:無論發(fā)生什么異常(除復(fù)位),內(nèi)核總是會首先將 PC-4 放到LR寄存器中。(PC始終指向你要取指的指令的地址 即:PC = 當(dāng)前指令物理地址 + 8)
IRQ異常發(fā)生時,cpu已經(jīng)自動更新pc值(4+8+4=10),=》LR ?= c(10-4),指向的第三條指令,如果不進(jìn)行減4處理,我們回來將會漏執(zhí)行第二條指令,所以PC恢復(fù)的時候就需要LR減4,所以正常從子程序返回的時候會使用如:
SUBS PC, LR,#4???? 返回到當(dāng)前指令的下一條指令
未定義指令異常時,cpu還沒有自動更新pc值(4+8=c),=》LR ?= 8(c-4) ?;因為該指令未定義,所以返回時就不應(yīng)該返回到這條未定義指令,而是返回到它的下一條指令,R14中保存的剛好就是下一條指令的地址,所以就不用計算了,直接將R14賦值給PC就行了,即mov PC, LR
預(yù)取指令異常時,即cpu還沒有自動更新pc值(4+8=c),=》LR ?= 8(c-4) ?;出現(xiàn)預(yù)取指令異常后,要重新再執(zhí)行一次這條指令,這也是與其他異常不太一樣的地方。,所以PC恢復(fù)的時候就需要R14減4,即SUBS PC, LR,#4
數(shù)據(jù)中止異常,這個異常表示當(dāng)前存儲器的訪問不能完成,是在本指令執(zhí)行完成后才發(fā)生的,即cpu已經(jīng)自動更新pc值(4+8+4=10)值,=》LR ?= c(10-4),我們從異常返回時,要重新再執(zhí)行一次這條指令,所以PC恢復(fù)的時候就需要R14減8,即SUBS PC, LR,#8