www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于嵌入式Linux的內(nèi)核錯(cuò)誤跟蹤技術(shù)

隨著嵌入式Linux系統(tǒng)的廣泛應(yīng)用,對(duì)系統(tǒng)的可靠性提出了更高的要求,尤其是涉及到生命財(cái)產(chǎn)等重要領(lǐng)域,要求系統(tǒng)達(dá)到安全完整性等級(jí)3級(jí)以上[1],故障率(每小時(shí)出現(xiàn)危險(xiǎn)故障的可能性)為10-7以下,相當(dāng)于系統(tǒng)的平均故障間隔時(shí)間(MTBF)至少要達(dá)到1141年以上,因此提高系統(tǒng)可靠性已成為一項(xiàng)艱巨的任務(wù)。對(duì)某公司在工業(yè)領(lǐng)域14 878個(gè)控制器系統(tǒng)的應(yīng)用調(diào)查表明,從2004年初到2007年9月底,隨著硬軟件的不斷改進(jìn),根據(jù)錯(cuò)誤報(bào)告統(tǒng)計(jì)的故障率已降低到2004年的五分之一以下,但查找錯(cuò)誤的時(shí)間卻增加到原來(lái)的3倍以上。

    這種解決問題所需時(shí)間呈上升的趨勢(shì)固然有軟件問題,但缺乏必要的手段以輔助解決問題才是主要的原因。通過對(duì)故障的統(tǒng)計(jì)跟蹤發(fā)現(xiàn),難以解決的軟件錯(cuò)誤和從發(fā)現(xiàn)到解決耗時(shí)較長(zhǎng)的軟件錯(cuò)誤都集中在操作系統(tǒng)的核心部分,這其中又有很大比例集中在驅(qū)動(dòng)程序部分[2]。因此,錯(cuò)誤跟蹤技術(shù)被看成是提高系統(tǒng)安全完整性等級(jí)的一個(gè)重要措施[1],大多數(shù)現(xiàn)代操作系統(tǒng)均為發(fā)展提供了操作系統(tǒng)內(nèi)核“崩潰轉(zhuǎn)儲(chǔ)”機(jī)制,即在軟件系統(tǒng)宕機(jī)時(shí),將內(nèi)存內(nèi)容保存到磁盤[3],或者通過網(wǎng)絡(luò)發(fā)送到故障服務(wù)器[3],或者直接啟動(dòng)內(nèi)核調(diào)試器[4]等,以供事后分析改進(jìn)。

    基于Linux操作系統(tǒng)內(nèi)核的崩潰轉(zhuǎn)儲(chǔ)機(jī)制近年來(lái)有以下幾種:

    (1) LKCD(Linux Kernel Crash Dump)機(jī)制[3];

    (2) KDUMP(Linux Kernel Dump)機(jī)制[4];

    (3) KDB機(jī)制[5];

    (4) KGDB機(jī)制[6]。

    綜合上述幾種機(jī)制可以發(fā)現(xiàn),這四種機(jī)制之間有以下三個(gè)共同點(diǎn):

    (1) 適用于為運(yùn)算資源豐富、存儲(chǔ)空間充足的應(yīng)用場(chǎng)合;

    (2) 發(fā)生系統(tǒng)崩潰后恢復(fù)時(shí)間無(wú)嚴(yán)格要求;

    (3) 主要針對(duì)較通用的硬件平臺(tái),如X86平臺(tái)。

    在嵌入式應(yīng)用場(chǎng)合想要直接使用上列機(jī)制中的某一種,卻遇到以下三個(gè)難點(diǎn)無(wú)法解決:

    (1) 存儲(chǔ)空間不足

    嵌入式系統(tǒng)一般采用Flash作為存儲(chǔ)器,而Flash容量有限,且可能遠(yuǎn)遠(yuǎn)小于嵌入式系統(tǒng)中的內(nèi)存容量。因此將全部?jī)?nèi)存內(nèi)容保存到Flash不可行。

    (2) 記錄時(shí)間要求盡量短

    嵌入式系統(tǒng)一般有復(fù)位響應(yīng)時(shí)間盡量短的要求,有的嵌入式操作系統(tǒng)復(fù)位重啟時(shí)間不超過2s,而上述幾種可用于Linux系統(tǒng)的內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制耗時(shí)均不可能在30s內(nèi)。寫Flash的操作也很耗時(shí)間,實(shí)驗(yàn)顯示,寫2MB數(shù)據(jù)到Flash耗時(shí)達(dá)到400ms之多。

    (3) 要求能夠支持特定的硬件平臺(tái)

    嵌入式系統(tǒng)的硬件多種多樣,上面提到的四種機(jī)制均是針對(duì)X86平臺(tái)提供了較好的支持,而對(duì)于其他體系的硬件支持均不成熟。

    由于這些難點(diǎn)的存在,要將上述四種內(nèi)核崩潰轉(zhuǎn)儲(chǔ)機(jī)制中的一種移植到特定的嵌入式應(yīng)用平臺(tái)是十分困難的。因此,針對(duì)上述嵌入式系統(tǒng)的三個(gè)特點(diǎn),本文介紹一種基于特定平臺(tái)的嵌入式Linux內(nèi)核崩潰信息記錄機(jī)制LCRT(Linux Crash Record and Trace),為定位嵌入式Linux系統(tǒng)中軟件故障和解決軟件故障提供輔助手段。

1 Linux內(nèi)核崩潰的分析

    分析Linux內(nèi)核對(duì)于運(yùn)行期間各種“陷阱”的處理可以得知,Linux內(nèi)核對(duì)于應(yīng)用程序?qū)е碌腻e(cuò)誤可以予以監(jiān)控,在應(yīng)用程序發(fā)生除零、內(nèi)存訪問越界、緩沖區(qū)溢出等錯(cuò)誤時(shí),Linux內(nèi)核的異常處理例程可以對(duì)這些由應(yīng)用程序引起的異常情況予以處理。當(dāng)應(yīng)用程序產(chǎn)生不可恢復(fù)的錯(cuò)誤時(shí),Linux內(nèi)核可以僅僅終止產(chǎn)生錯(cuò)誤的應(yīng)用程序,其他應(yīng)用程序仍然可以正常運(yùn)行。

    如果Linux內(nèi)核本身或者新開發(fā)的Linux內(nèi)核模塊存在bug,產(chǎn)生了“除零”,“內(nèi)存訪問越界”、“緩沖區(qū)溢出”等錯(cuò)誤,同樣會(huì)由Linux內(nèi)核的異常處理例程來(lái)處理。Linux內(nèi)核通過在異常處理程序中判斷,如果發(fā)現(xiàn)是“嚴(yán)重的不可恢復(fù)”的內(nèi)核異常,則會(huì)導(dǎo)致“內(nèi)核恐慌”(kernel panic),即Linux內(nèi)核崩潰。圖1所示為L(zhǎng)inux內(nèi)核對(duì)異常情況的處理流程。

2 LCRT機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)

    通過對(duì)Linux內(nèi)核代碼的分析可知,Linux內(nèi)核本身提供了一種“內(nèi)核通知機(jī)制”[7-8],并預(yù)定義了“內(nèi)核事件通知鏈”,使得Linux內(nèi)核擴(kuò)展開發(fā)人員可以通過這些預(yù)定義的內(nèi)核事件通知鏈在特定的內(nèi)核事件發(fā)生時(shí)執(zhí)行附加的處理流程。通過對(duì)Linux內(nèi)核源代碼的研究發(fā)現(xiàn),對(duì)于上文中提到的“嚴(yán)重不可恢復(fù)的內(nèi)核異常”,預(yù)定義了一個(gè)通知鏈和通知點(diǎn),使得在發(fā)生Linux內(nèi)核崩潰之后,可以在Linux內(nèi)核的panic函數(shù)中預(yù)定義的一個(gè)“內(nèi)核崩潰通知鏈”[7]上掛接LCRT機(jī)制來(lái)獲得Linux內(nèi)核崩潰現(xiàn)場(chǎng)的一些信息并記錄到非易失性存儲(chǔ)器中,以便分析引起Linux內(nèi)核崩潰的原因。

2.1 設(shè)計(jì)要點(diǎn)

    LCRT機(jī)制的設(shè)計(jì)和實(shí)現(xiàn)基于如下特定的機(jī)制:

    (1) 編譯器選項(xiàng)與內(nèi)核依賴

    Linux內(nèi)核及相應(yīng)的驅(qū)動(dòng)程序都采用GNU[9]的開源編譯器GCC[9]編譯,為了結(jié)合LCRT機(jī)制方便地提取信息和記錄信息,需要采用特定的GCC編譯器選項(xiàng)來(lái)編譯Linux內(nèi)核和相關(guān)的驅(qū)動(dòng)程序以及應(yīng)用程序。用到的選項(xiàng)為:-mpoke-function-name[9]。使用這個(gè)選項(xiàng)編譯出的二進(jìn)制程序中可以包含C語(yǔ)言函數(shù)名稱的信息,以方便函數(shù)調(diào)用鏈回溯時(shí)記錄信息的可讀性。

    (2) Linux內(nèi)核notify_chain機(jī)制[8]

    Linux內(nèi)核提供“通知鏈”功能,并預(yù)定義了一個(gè)內(nèi)核崩潰通知鏈,在Linux內(nèi)核的異常處理例程中判斷出系統(tǒng)進(jìn)入“不可恢復(fù)”狀態(tài)時(shí),會(huì)沿預(yù)定義的通知鏈順序調(diào)用注冊(cè)到相應(yīng)鏈中的通知函數(shù)。

    (3) 函數(shù)調(diào)用的棧布局

    Linux內(nèi)核的絕大部分由C語(yǔ)言實(shí)現(xiàn),而且C語(yǔ)言也多用來(lái)進(jìn)行Linux內(nèi)核開發(fā)。Linux內(nèi)核及使用LKM擴(kuò)展而加入Linux內(nèi)核執(zhí)行環(huán)境的代碼是有規(guī)律可循的,這些代碼在執(zhí)行過程中產(chǎn)生的棧布局和這些規(guī)律的代碼相關(guān)聯(lián)。例如,這些函數(shù)在執(zhí)行函數(shù)之前會(huì)保存本函數(shù)調(diào)用后的返回地址、本函數(shù)被調(diào)用時(shí)傳遞過來(lái)的參數(shù)及調(diào)用本函數(shù)的函數(shù)所擁有的棧幀的棧底。

2.2 LCRT機(jī)制的設(shè)計(jì)思想

    LCRT機(jī)制分為L(zhǎng)inux內(nèi)核模塊[8]部分和Linux用戶程序部分。內(nèi)核模塊部分的設(shè)計(jì)采用了Linux內(nèi)核模塊的模式而不是直接修改Linux內(nèi)核。這樣的設(shè)計(jì)降低了Linux內(nèi)核和LCRT機(jī)制之間的耦合度,同時(shí)滿足了Linux內(nèi)核和LCRT機(jī)制獨(dú)立升級(jí)完善的便利性。用戶程序部分完成從非易失性存儲(chǔ)器中讀取、清除LCRT機(jī)制保存的信息等相關(guān)功能。

    在LCRT機(jī)制的設(shè)計(jì)中,針對(duì)嵌入式系統(tǒng)的特點(diǎn),其設(shè)計(jì)決策有:

    (1) 將對(duì)于解決和定位問題最具輔助意義的函數(shù)調(diào)用關(guān)系鏈記錄下來(lái)。

    (2) 為了不占用過多的存儲(chǔ)空間,有選擇性地將函數(shù)調(diào)用序列上的函數(shù)各自用到的棧內(nèi)容保存起來(lái),而不是保存全部?jī)?nèi)容。

    (3) 將記錄的信息保存到非易失性存儲(chǔ)器中,這樣既達(dá)到了掉電保存的目的、又縮短了寫入時(shí)間。

    LCRT機(jī)制的設(shè)計(jì)包括以下五個(gè)方面。

    (1) 設(shè)計(jì)Linux內(nèi)核模塊、動(dòng)態(tài)地加載LCRT機(jī)制、盡量少地修改Linux內(nèi)核代碼。

    (2)在相應(yīng)、預(yù)定義的Linux內(nèi)核通知鏈上掛接LCRT的通知函數(shù)。

    (3) 在LCRT機(jī)制的通知處理函數(shù)中進(jìn)行堆?;厮莸玫胶瘮?shù)調(diào)用信息。

    (4) 記錄回溯到的函數(shù)調(diào)用信息和堆棧空間內(nèi)容到非易失性存儲(chǔ)器。

    (5) 開發(fā)用戶空間的工具,可以從非易失性存儲(chǔ)器中讀取保存的信息。

2.3 LCRT機(jī)制的實(shí)現(xiàn)

    LCRT機(jī)制的實(shí)現(xiàn)可參照2.2節(jié)的設(shè)計(jì)思想,分步予以實(shí)現(xiàn)。限于篇幅,本文不過多涉及Linux內(nèi)核模塊的原理和實(shí)現(xiàn)相關(guān)的細(xì)節(jié),僅僅給出LCRT機(jī)制的內(nèi)核模塊實(shí)現(xiàn)偽代碼。用偽代碼描述LCRT機(jī)制的加載函數(shù)如下:

    int lcrt_init(void) 

        {

            printk("Registering my__panic notifier.n");

            bt_nvram_ptr=(volatile unsigned char*)ioremap_

nocache (BT_NVRAM_BASE,BT_NVRAM_LENGTH);

            bt_nvram_index+=sizeof(struct bt_info);

            *)bt_nvram_ptr,BT_NVRAM_LENGTH);

            notifier_chain_register(&panic_notifier_list,&my_

            panic_block);

            return 0;

        }

    LCRT機(jī)制的通知處理函數(shù)完成函數(shù)調(diào)用關(guān)系回溯、得到函數(shù)名稱、函數(shù)棧內(nèi)容等工作,限于篇幅,在這里用下面?zhèn)未a說(shuō)明:

    void ll_bt_information(struct pt_regs *pr)

    {

    變量定義等初始化工作

    do  {

        reglist=*(unsigned long *)(*myfp-8);

        //從函數(shù)棧幀的頂部獲取函數(shù)開始執(zhí)行時(shí)保存的寄存器信息

      //從函數(shù)的代碼區(qū)中取得函數(shù)的名稱

        //從函數(shù)的棧幀里取出函數(shù)執(zhí)行函數(shù)體代碼之前保存的函數(shù)參數(shù)信息

      //從本函數(shù)的棧幀中得到調(diào)用本函數(shù)的代碼所在位置和調(diào)用本函數(shù)的函數(shù)棧幀的棧底

    }while(直到函數(shù)調(diào)用鏈的鏈頭);

    

     //取得函數(shù)調(diào)用棧幀的內(nèi)容

        //填充信息記錄的記錄頭部

        //將上面的循環(huán)中取得的信息保存到非易失性存儲(chǔ)器中

    write_to_nvram((void *)bt_nvram_ptr,&bt_record_header,sizeof(bt_info_t));

    }

3 驗(yàn)證評(píng)估LCRT機(jī)制

3.1 部署LCRT機(jī)制

    部署LCRT機(jī)制,使LCRT機(jī)制發(fā)揮作用前需要做的相關(guān)工作有:

    (1)針對(duì)目標(biāo)Linux內(nèi)核編譯LCRT機(jī)制的Linux內(nèi)核模塊部分;

    (2) 將LCRT機(jī)制的內(nèi)核模塊部分載入Linux內(nèi)核。

3.2 實(shí)驗(yàn)結(jié)果

    為了實(shí)驗(yàn)LCRT機(jī)制的作用效果,構(gòu)造一個(gè)會(huì)造成Linux內(nèi)核崩潰的設(shè)備驅(qū)動(dòng)模塊,記這個(gè)內(nèi)核驅(qū)動(dòng)模塊為bugguy.ko,列出如下所示的bugguy.ko中會(huì)引起Linux內(nèi)核崩潰的代碼如下所示:

    irqreturn_t my_timer_interrupt(int irq,void *dev_id,struct pt_regs* regs)

    {

    確認(rèn)硬件狀態(tài)并清除中斷狀態(tài)

    if(ujiffies > 5000) {

        void * ill_pointer=NULL;

      *(unsigned long *)ill_pointer=0;

    }

    else {

        ujiffies++;

      }

      return IRQ_HANDLED;

    }

    說(shuō)明:用黑體標(biāo)出的代碼即為產(chǎn)生bug的代碼

    從上面的代碼可以看出,這個(gè)錯(cuò)誤是對(duì)空指針進(jìn)行解析而造成的。在一個(gè)中斷處理函數(shù)中如果發(fā)生對(duì)空指針的解析,將會(huì)引起Linux內(nèi)核的崩潰。在部署完成LCRT機(jī)制的嵌入式linux系統(tǒng)上將這個(gè)bugguy.ko載入Linux內(nèi)核,使得會(huì)引起Linux內(nèi)核崩潰的中斷處理程序得以運(yùn)行,LCRT機(jī)制可以將相關(guān)的信息保存到非易失性存儲(chǔ)器中,在系統(tǒng)復(fù)位后,通過LCRT機(jī)制的用戶空間工具,可以將保存的信息讀取出來(lái)。實(shí)驗(yàn)結(jié)果顯示,可以得到如圖2所示的函數(shù)調(diào)用鏈信息。

圖2標(biāo)注即為會(huì)引起Linux內(nèi)核崩潰的錯(cuò)誤代碼的中斷處理函數(shù)即真正引起系統(tǒng)宕機(jī)的“罪魁禍?zhǔn)住?。而記錄下的所有信息僅僅占用了不到1KB的存儲(chǔ)空間,寫入非易失性存儲(chǔ)器所耗用的時(shí)間控制在50ms以內(nèi)。在使用少量空間和少量時(shí)間的情況下,所記錄下的信息對(duì)于查找問題和解決問題都有較大的幫助。

    實(shí)驗(yàn)結(jié)果表明,在LCRT機(jī)制的作用下,可以快速地定位到嵌入式Linux系統(tǒng)中隱藏的可能會(huì)導(dǎo)致系統(tǒng)宕機(jī)的軟件缺陷。這就為后續(xù)的故障解決和軟件完善提供了關(guān)鍵的輔助信息。對(duì)嵌入式Linux內(nèi)核而言,即是為提高Linux內(nèi)核的穩(wěn)定性和可靠性提供了幫助。

    在基于ARM的嵌入式Linux應(yīng)用中,開發(fā)LCRT機(jī)制來(lái)記錄系統(tǒng)內(nèi)核發(fā)生崩潰時(shí)引起崩潰的函數(shù)調(diào)用鏈和棧信息到非易失性存儲(chǔ)器中,截至目前為止,LCRT機(jī)制可以記錄基于ARM的嵌入式Linux內(nèi)核發(fā)生崩潰時(shí)的函數(shù)調(diào)用鏈信息,可直接得到函數(shù)名稱、函數(shù)調(diào)用鏈中單個(gè)函數(shù)被調(diào)用時(shí)的參數(shù)信息以及函數(shù)調(diào)用鏈中的函數(shù)各自的棧幀信息。這些記錄下來(lái)的信息對(duì)于完善和發(fā)展基于ARM的嵌入式Linux應(yīng)用具有重要的輔助意義。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

成都2022年10月19日 /美通社/ -- 近期,平安養(yǎng)老險(xiǎn)積極籌備個(gè)人養(yǎng)老金的產(chǎn)品設(shè)計(jì)和系統(tǒng)開發(fā)工作,發(fā)展多樣化的養(yǎng)老金融產(chǎn)品,推動(dòng)商業(yè)養(yǎng)老保險(xiǎn)、個(gè)人養(yǎng)老金、專屬商業(yè)養(yǎng)老保險(xiǎn)等產(chǎn)品供給。 搭養(yǎng)老政策東風(fēng) ...

關(guān)鍵字: 溫度 BSP 東風(fēng) 大眾

廣東佛山2022年10月19日 /美通社/ -- 空間是人居生活的基礎(chǔ)單元,承載著生存與活動(dòng)的最基本功能。而對(duì)于理想空間的解構(gòu)意義卻在物理性容器之外,體現(xiàn)出人們對(duì)于空間和生活深層關(guān)系的思考,同時(shí)也塑造著人與空間的新型連接...

關(guān)鍵字: 溫度 BSP 智能化 進(jìn)程

上海2022年10月19日 /美通社/ -- 10月17日晚間,安集科技披露業(yè)績(jī)預(yù)告。今年前三季度,公司預(yù)計(jì)實(shí)現(xiàn)營(yíng)業(yè)收入7.54億元至8.33億元,同比增長(zhǎng)60.24%至77.03%;歸母凈利潤(rùn)預(yù)計(jì)為1.73億...

關(guān)鍵字: 電子 安集科技 BSP EPS

北京2022年10月19日 /美通社/ -- 10月18日,北京市經(jīng)濟(jì)和信息化局發(fā)布2022年度第一批北京市市級(jí)企業(yè)技術(shù)中心創(chuàng)建名單的通知,諾誠(chéng)健華正式獲得"北京市企業(yè)技術(shù)中心"認(rèn)定。 北京市企業(yè)技...

關(guān)鍵字: BSP ARMA COM 代碼

北京2022年10月18日 /美通社/ -- 10月14日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國(guó)軟件定義存儲(chǔ)及超融合市場(chǎng)研究報(bào)告》,報(bào)告顯示:2022年上半年浪潮超融合銷售額同比增長(zhǎng)59.4%,近5倍于...

關(guān)鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心

上海2022年10月18日 /美通社/ -- 2022年9月5日,是首都銀行集團(tuán)成立60周年的紀(jì)念日。趁著首都銀行集團(tuán)成立60周年與首都銀行(中國(guó))在華深耕經(jīng)營(yíng)12年的“大日子”,圍繞作為外資金融機(jī)構(gòu)對(duì)在華戰(zhàn)略的構(gòu)想和業(yè)...

關(guān)鍵字: 數(shù)字化 BSP 供應(yīng)鏈 控制

東京2022年10月18日  /美通社/ -- NIPPON EXPRESS HOLDINGS株式會(huì)社(NIPPON EXPRESS HOLDINGS, INC.)旗下集團(tuán)公司上海通運(yùn)國(guó)際物流有限公司(Nipp...

關(guān)鍵字: 溫控 精密儀器 半導(dǎo)體制造 BSP

廣州2022年10月18日 /美通社/ -- 10月15日,第 132 屆中國(guó)進(jìn)出口商品交易會(huì)("廣交會(huì)")于"云端"開幕。本屆廣交會(huì)上高新技術(shù)企業(yè)云集,展出的智能產(chǎn)品超過140,...

關(guān)鍵字: 中國(guó)智造 BSP 手機(jī) CAN

要問機(jī)器人公司哪家強(qiáng),波士頓動(dòng)力絕對(duì)是其中的佼佼者。近來(lái)年該公司在機(jī)器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機(jī)器人會(huì)后空翻,自主爬樓梯等。這不,波士頓動(dòng)力又發(fā)布了其機(jī)器人組團(tuán)跳男團(tuán)舞的新視頻,表演的機(jī)器人包括...

關(guān)鍵字: 機(jī)器人 BSP 工業(yè)機(jī)器人 現(xiàn)代汽車

南京2022年10月17日 /美通社/ -- 日前《2022第三屆中國(guó)高端家電品牌G50峰會(huì)》于浙江寧波落幕,來(lái)自兩百余名行業(yè)大咖、專家學(xué)者共同探討了在形勢(shì)依然嚴(yán)峻的當(dāng)下,如何以科技創(chuàng)新、高端化轉(zhuǎn)型等手段,幫助...

關(guān)鍵字: LINK AI BSP 智能家電

嵌入式教程

6897 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉