CPU的大小端模式?是指在存儲和處理多字節(jié)數(shù)據(jù)時,字節(jié)的順序是如何排列的。它涉及到字節(jié)在內(nèi)存中的存儲方式以及讀取和解釋這些字節(jié)的順序。主要有兩種大小端模式:?大端模式(Big-Endian)?和?小端模式(Little-Endian)?。
大端模式(Big-Endian)
在大端模式下,數(shù)據(jù)的高位字節(jié)存儲在低地址,低位字節(jié)存儲在高地址。例如,對于十六進制數(shù)0x12345678,在大端模式下,其在內(nèi)存中的存儲順序為12 34 56 78。這種存儲方式符合人類的直觀認知,適合需要人類直接讀取和處理數(shù)據(jù)的場景?12。
小端模式(Little-Endian)
與大端模式相反,小端模式下數(shù)據(jù)的低位字節(jié)存儲在低地址,高位字節(jié)存儲在高地址。例如,對于十六進制數(shù)0x12345678,在小端模式下,其在內(nèi)存中的存儲順序為78 56 34 12。小端模式在計算機系統(tǒng)中更為常見,因為它使得數(shù)據(jù)的讀取和寫入更加高效?12。
大小端模式的優(yōu)缺點
?大端模式的優(yōu)點?:
判斷正負性非常容易,因為高位字節(jié)表示符號位。
?大端模式的缺點?:
數(shù)據(jù)讀取順序與人類閱讀習慣相反,可能導致效率較低。
?小端模式的優(yōu)點?:
數(shù)據(jù)讀取順序與人類閱讀習慣一致,讀取和寫入效率較高。
?小端模式的缺點?:
判斷正負性需要更多的計算步驟。
不同體系結(jié)構(gòu)的大小端模式
不同的體系結(jié)構(gòu)有不同的默認模式:
?x86架構(gòu)?:通常采用小端模式。
?網(wǎng)絡(luò)協(xié)議?:常用的網(wǎng)絡(luò)字節(jié)序采用大端模式(例如TCP/IP協(xié)議)?。
為什么會有大小端模式之分呢?
因為在計算機系統(tǒng)中,我們是以字節(jié)為單位的,每個地址單元都對應(yīng)著一個字節(jié),一個字節(jié)為8bit。
但是在C語言中除了8bit的char之外,還有16bit的short型,32bit的int型。另外,對于位數(shù)大于8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個字節(jié),那么必然存在著一個如果將多個字節(jié)安排的問題。因此就導致了大端存儲模式和小端存儲模式。
例如一個16bit的short型x,在內(nèi)存中的地址為0x0010,x的值為0x1122,那么0x11為高字節(jié),0x22為低字節(jié)。
對于大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,剛好相反。
一、大小端存儲機制
1.大端模式(Big-Endian)
大端模式,也被稱為大字節(jié)序。在這種模式下,數(shù)據(jù)的高位字節(jié)存儲在低地址,低位字節(jié)存儲在高地址。這就好比我們?nèi)祟悤鴮憯?shù)字的習慣,從左到右,高位在前,低位在后。例如,對于一個十六進制數(shù) 0x12345678,它由4個字節(jié)組成,分別是 0x12、0x34、0x56 和 0x78。在大端模式下,存儲順序為 0x12 0x34 0x56 0x78。從內(nèi)存地址的角度來看,低地址處存儲的是高位字節(jié) 0x12,隨著地址的升高,依次存儲 0x34、0x56 和 0x78。這種存儲方式符合人類的直觀認知,在一些需要人類直接讀取和處理數(shù)據(jù)的場景中具有一定的優(yōu)勢。
為了更好地理解大端模式,我們可以想象一個書架,每一層代表一個內(nèi)存地址,而書本則代表字節(jié)數(shù)據(jù)。當我們按照大端模式擺放書本時,會將重要的信息(高位字節(jié))放在書架的底層(低地址),隨著層數(shù)的增加,依次放置次要的信息(低位字節(jié))。這樣,當我們從書架底部開始讀取書本時,就能按照我們習慣的順序獲取數(shù)據(jù)。
大小端(Endianess)是指計算機系統(tǒng)在存儲多字節(jié)數(shù)據(jù)時,字節(jié)的順序,即存儲數(shù)據(jù)的字節(jié)順序。
計算機系統(tǒng)的內(nèi)存是以字節(jié)為單位進行劃分的,每個地址單元都對應(yīng)著一個字節(jié),一個字節(jié)的大小為8bit,可以存放一個8位的二進制數(shù),比如10101010。但是在C語言中除了8bit的char類型之外還有16bit的short類型,32bit的long類型,這主要取決于具體的編譯器。且對于位數(shù)大于8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于1個字節(jié),那么必然存在著如何將多個字節(jié)安排進入內(nèi)存的問題,因為就產(chǎn)生的大端存儲模式和小端存儲模式。
2.小端模式(Little-Endian)
與大端模式相反,小端模式(Little-Endian)下,數(shù)據(jù)的低位字節(jié)存儲在低地址,高位字節(jié)存儲在高地址。同樣以 0x12345678 為例,在小端模式下,存儲順序為 0x78 0x56 0x34 0x12。這意味著在低地址處存儲的是低位字節(jié) 0x78,而高位字節(jié) 0x12 則存儲在高地址處。小端模式在x86/ARM等常見的處理器架構(gòu)中被廣泛使用。
我們依然以書架為例來理解小端模式。在小端模式下,我們會將不太重要的信息(低位字節(jié))放在書架的底層(低地址),而重要的信息(高位字節(jié))則放在書架的上層(高地址)。這種存儲方式雖然與人類的書寫習慣不同,但在計算機的處理過程中卻有著獨特的優(yōu)勢。例如,在進行數(shù)據(jù)的加法、減法等運算時,小端模式可以更方便地處理低位字節(jié),提高運算效率。
二、數(shù)據(jù)傳輸中的大小端問題
當一臺小端機器需要向網(wǎng)絡(luò)發(fā)送數(shù)據(jù)時,它必須先將數(shù)據(jù)從本機的小端模式轉(zhuǎn)換為大端模式。這是因為網(wǎng)絡(luò)協(xié)議規(guī)定了數(shù)據(jù)在網(wǎng)絡(luò)中傳輸時必須采用大端模式,只有這樣,接收方才能正確地解析數(shù)據(jù)。例如,一臺采用x86架構(gòu)的計算機(小端模式)要向另一臺計算機發(fā)送一個32位的整數(shù) 0x12345678,在發(fā)送之前,它需要將這個數(shù)據(jù)轉(zhuǎn)換為大端模式 0x12 0x34 0x56 0x78 再進行發(fā)送。
在接收數(shù)據(jù)時,小端機器又需要將接收到的大端模式數(shù)據(jù)轉(zhuǎn)換回小端模式,以便在本機上進行正確的處理。例如,當這臺x86計算機接收到一個來自網(wǎng)絡(luò)的32位整數(shù)數(shù)據(jù)時,它會先將數(shù)據(jù)從大端模式轉(zhuǎn)換為小端模式,然后再進行后續(xù)的處理。這個轉(zhuǎn)換過程就像是一場翻譯工作,確保數(shù)據(jù)在不同的“語言環(huán)境”(端模式)之間能夠正確地交流。
網(wǎng)絡(luò)協(xié)議強制使用大端字節(jié)序的原因主要是為了保證數(shù)據(jù)的一致性和兼容性。不同的計算機可能采用不同的端模式,如果沒有統(tǒng)一的標準,數(shù)據(jù)在傳輸過程中就會出現(xiàn)混亂。例如,一個小端機器發(fā)送的數(shù)據(jù)在另一個大端機器上可能會被錯誤地解析,導致數(shù)據(jù)的錯誤處理。通過統(tǒng)一采用大端字節(jié)序,網(wǎng)絡(luò)協(xié)議為不同端模式的計算機之間搭建了一座溝通的橋梁,使得數(shù)據(jù)能夠在網(wǎng)絡(luò)中準確地傳輸和共享。
大小端的轉(zhuǎn)換
在處理數(shù)據(jù)時,尤其是在網(wǎng)絡(luò)通信和文件讀寫中,可能需要在大端(Big Endian)和小端(Little Endian)之間進行轉(zhuǎn)換。以下是幾種常見的大小端轉(zhuǎn)換方法,包括使用標準庫函數(shù)和手動實現(xiàn)。
使用標準庫函數(shù)
在許多C標準庫中,提供了網(wǎng)絡(luò)字節(jié)序的轉(zhuǎn)換函數(shù),可以用來進行大小端的轉(zhuǎn)換。以下是幾個常用的函數(shù):
htonl():將主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(32位整數(shù))
htons():將主機字節(jié)順序轉(zhuǎn)換為網(wǎng)絡(luò)字節(jié)順序(16位整數(shù))
ntohl():將網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(32位整數(shù))
ntohs():將網(wǎng)絡(luò)字節(jié)順序轉(zhuǎn)換為主機字節(jié)順序(16位整數(shù))