armasm是ARM匯編語(yǔ)言的交叉編譯器,本節(jié)將詳細(xì)介紹它的使用方法。
Thumb指令集把32位ARM指令集的一個(gè)子集編碼為一個(gè)16位的指令集。在16位外部數(shù)據(jù)總線寬度下,ARM處理器上使用Thumb指令的性能要比使用ARM指令的性能更好。
所有的Thumb指令都是16位的。它們都是ARM指令重新編碼得到的,所以繼承了ARM指令集的許多特點(diǎn)。
Thumb異常中斷產(chǎn)生指令與ARM指令集下的異常中斷指令十分相似。同ARM指令集相同,Thumb指令集中同樣包含兩條異常中斷產(chǎn)生指令:軟件中斷指令SWI用于產(chǎn)生SWI異常中斷;斷點(diǎn)中斷指令BKPT主要用于產(chǎn)生軟件斷點(diǎn),供調(diào)試程序使用(只在ARMv5及以上版本中使用)。
對(duì)3級(jí)流水線的ARM處理器來(lái)說(shuō),做相對(duì)較小的改動(dòng)就可以實(shí)現(xiàn)Thumb指令集(5級(jí)流水線的實(shí)現(xiàn)要復(fù)雜些)。為實(shí)現(xiàn)Thumb指令集,在指令流水線中增加了Thumb指令解碼邏輯,該解碼邏輯將預(yù)取的Thumb指令轉(zhuǎn)換成等價(jià)的ARM指令。圖11.66顯示了Thumb指令的擴(kuò)展邏輯組織。
Thumb以其較高的代碼密度和在窄存儲(chǔ)器上的性能,使得它在很多系統(tǒng)中得到廣泛應(yīng)用。但在很多情況下,還是不得不使用ARM指令,這是因?yàn)椋?/p>
內(nèi)聯(lián)匯編和嵌入型匯編是包含在C/C++編譯器中的匯編器。使用它可以在C/C++程序中實(shí)現(xiàn)C/C++語(yǔ)言不能完成的一些工作。例如,在下面幾種情況中必須使用內(nèi)聯(lián)匯編或嵌入型匯編。
多數(shù)嵌入式應(yīng)用程序最初都是在原型環(huán)境下開發(fā)的。無(wú)論什么樣的原型仿真環(huán)境與最終產(chǎn)品環(huán)境都是有差異的。因此,考慮如何將嵌入式應(yīng)用程序從其所依賴的開發(fā)工具或調(diào)試環(huán)境中移植到在目標(biāo)硬件上獨(dú)立運(yùn)行是非常重要的。
在匯編代碼中訪問(wèn)C全局變量,只能通過(guò)地址間接訪問(wèn)全局變量。要訪問(wèn)全局變量,必須在匯編中使用 IMPORT 偽操作輸入全局變量,然后將地址載入寄存器??梢愿鶕?jù)變量的類型使用載入和存儲(chǔ)指令訪問(wèn)該變量。
本節(jié)描述如何在C++代碼中使用C頭文件。從C++調(diào)用C頭文件之前,C頭文件必須包含在extern "C"命令中。本節(jié)包含以下兩部分內(nèi)容:
本節(jié)提供一些示例,顯示如何從C++調(diào)用C和匯編語(yǔ)言代碼,以及從C和匯編語(yǔ)言調(diào)用 C++ 代碼。其中包括調(diào)用約定和數(shù)據(jù)類型。主要包括下面內(nèi)容:
默認(rèn)情況下,C庫(kù)利用semihosting機(jī)制來(lái)提供設(shè)備驅(qū)動(dòng)級(jí)的功能,使得主機(jī)能夠用作輸入和輸出設(shè)備。這種機(jī)制對(duì)于嵌入式開發(fā)十分有用,因?yàn)橛糜陂_發(fā)的硬件系統(tǒng)通常沒(méi)有最終系統(tǒng)的輸入和輸出設(shè)備。
任何運(yùn)行在實(shí)際硬件上的嵌入式應(yīng)用程序,都必須在啟動(dòng)時(shí)實(shí)現(xiàn)一些基本的系統(tǒng)初始化。本節(jié)將對(duì)此予以詳細(xì)討論。
在創(chuàng)建多任務(wù)嵌入式系統(tǒng)時(shí),最好有一個(gè)簡(jiǎn)單的方式來(lái)編寫、裝載及運(yùn)行各自獨(dú)立的任務(wù)。目前大多數(shù)的嵌入式系統(tǒng)不再使用自己定制的控制系統(tǒng),而使用操作系統(tǒng)來(lái)簡(jiǎn)化這個(gè)過(guò)程。較高級(jí)的操作系統(tǒng)采用基于硬件的存儲(chǔ)管理單元MMU來(lái)實(shí)現(xiàn)上述操作。
上一節(jié)介紹了如何使用Scatter文件對(duì)程序的代碼和數(shù)據(jù)進(jìn)行放置。但這些方法只有在外設(shè)和堆棧限制在源文件或頭文件中定義好的前提下才能使用。為了增加程序的靈活性,最好在Scatter文件中設(shè)置這些信息,本節(jié)將介紹這些方法。
本章主要講解C編譯器在代碼優(yōu)化時(shí)遇到的一些問(wèn)題。要編寫高效的C語(yǔ)言源代碼,必須了解C編譯器對(duì)什么形式的代碼有所改動(dòng),編譯器涉及的處理器結(jié)構(gòu)的限制,以及一些特殊的C編譯器的限制。
因?yàn)锳RM體系結(jié)構(gòu)本身并不包含除法運(yùn)算硬件,所以在ARM上實(shí)現(xiàn)除法是十分耗時(shí)的。ARM指令集中沒(méi)有直接提供除法匯編指令,當(dāng)代碼中出現(xiàn)除法運(yùn)算時(shí),ARM編譯器會(huì)調(diào)用C庫(kù)函數(shù)(有符合除法調(diào)用_rt_sdiv,無(wú)符合除法調(diào)用_rt_udiv),來(lái)實(shí)現(xiàn)除法操作。根據(jù)除數(shù)和被除數(shù)的不同,32bit的除法運(yùn)算一般要占有20-140個(gè)指令周期。
ARM指令都是可以條件執(zhí)行的。在代碼中使用條件執(zhí)行指令可以減小代碼密度并提高程序執(zhí)行效率。典型的條件執(zhí)行語(yǔ)句用在比較指令之后,形成程序的分支跳轉(zhuǎn)結(jié)構(gòu)。下面的例子顯示了條件執(zhí)行指令的典型用法。
通常,布爾表達(dá)式被用來(lái)檢測(cè)某個(gè)數(shù)值是否在特定的范圍內(nèi)。例如,在圖形窗口處理程序中,常使用布爾表達(dá)式判斷屏幕中一個(gè)點(diǎn)是否在當(dāng)前活動(dòng)窗口范圍內(nèi)。
循環(huán)體是程序設(shè)計(jì)與優(yōu)化的重點(diǎn)考慮對(duì)象。本節(jié)將著重講解在ARM上處理for和while循環(huán)最有效的方法。