日本网站一二三资源,国精品人伦一区二区三区蜜桃

當(dāng)前位置：首頁 > 技術(shù)學(xué)院 > 碼農(nóng)的荒島求生

[導(dǎo)讀]計算機網(wǎng)絡(luò)編程中一個非?；镜膯栴}：該怎樣表示client與server之間交互的數(shù)據(jù)，在往下看之前先想一想這個問題。

計算機網(wǎng)絡(luò)編程中一個非?；镜膯栴}：該怎樣表示client與server之間交互的數(shù)據(jù)，在往下看之前先想一想這個問題。

共識與協(xié)議

這個問題可不像看上去的那樣簡單，因為client進程和server進程運行在不同的機器上，這些機器可能運行在不同的處理器平臺、可能運行在不同的操作系統(tǒng)、可能是由不同的編程語言編寫的，server要怎樣才能識別出client發(fā)送的是什么數(shù)據(jù)呢？就像這樣：client給server發(fā)送了一段數(shù)據(jù)：

0101000100100001

server怎么能知道該怎樣“解讀”這段數(shù)據(jù)呢？

顯然，client和server在發(fā)送數(shù)據(jù)之前必須首先達成某種關(guān)于怎樣解讀數(shù)據(jù)的共識，這就是所謂的協(xié)議。

這里的協(xié)議可以是這樣的：“將每8個比特為一個單位解釋為無符號數(shù)字”，如果協(xié)議是這樣的，那么server接收到這串二進制后就會將其解析為81(01010001)與33(00100001)。

當(dāng)然，這里的協(xié)議也可以是這樣的：“將每8個比特為一個單位解釋為ASCII字符”，那么server接收到這串二進制后就將其解析為“Q!”。

可見，同樣一串二進制在不同的“上下文/協(xié)議”下有完全不一樣的解讀，這也是為什么計算機明明只認(rèn)知0和1但是卻能處理非常復(fù)雜任務(wù)的根本原因，因為一切都可以編碼為0和1，同樣的我們也可以從0和1中解析出我們想要的信息，這就是所謂的編解碼技術(shù)。

實際上不止0和1，我們也可以將信息編碼為摩斯密碼(Morse code)等，只不過計算機擅長處理0和1而已。

扯遠(yuǎn)了，回到本文的主題。

遠(yuǎn)程過程調(diào)用：RPC

作為程序員我們知道，client以及server之間不會簡單傳遞一串?dāng)?shù)字以及字符這樣簡單，尤其在互聯(lián)網(wǎng)大廠后端服務(wù)這種場景下。

當(dāng)我們在電商App搜索商品、打車App呼叫出租車以及刷短視頻時，每一次請求的背后在后端都涉及大量服務(wù)之間的交互，就像這樣：

完成一次客戶端請求gateway這個服務(wù)要調(diào)用N多個下游服務(wù)，所謂調(diào)用是說A服務(wù)向B服務(wù)發(fā)送一段數(shù)據(jù)（請求），B服務(wù)接收到這段數(shù)據(jù)后執(zhí)行相應(yīng)的函數(shù)，并將結(jié)果返回給A服務(wù)。

只不過對于服務(wù)A來說并不想關(guān)心網(wǎng)絡(luò)傳輸這樣的底層細(xì)節(jié)，如果能像調(diào)用本地函數(shù)一樣調(diào)用遠(yuǎn)程服務(wù)就好了，這就是所謂的RPC，經(jīng)典的實現(xiàn)方式是這樣的：

RPC對上層提供和普通函數(shù)一樣的接口，只不過在實現(xiàn)上封裝了底層復(fù)雜的網(wǎng)絡(luò)通信，RPC框架是當(dāng)前互聯(lián)網(wǎng)后端的基石之一，很多所謂互聯(lián)網(wǎng)后端的職位無非就是在此基礎(chǔ)之上堆業(yè)務(wù)邏輯。

本文我們不關(guān)心其中的細(xì)節(jié)，這里我們只關(guān)心在網(wǎng)絡(luò)層client是怎樣對請求參數(shù)進行編碼、server怎樣對請求參數(shù)進行解碼的，也就是本文開頭提出的問題。

信息的編解碼

在思考怎樣進行編解碼之前我們必須意識到：

client和server可能是用不同語言編寫的，你的編解碼方案必須通用且不能和語言綁定
編解碼方法的性能問題，尤其是對時間要求苛刻的服務(wù)

首先，我們最應(yīng)該能想到的就是以純文本的形式來表示。

純文本從來都是一種非常有友好的信息載體，為什么？很簡單，因為人類(我們)可以直接看懂，就像這段：

{ "widget": { "window": { "title": "Sample Konfabulator Widget", "name": "main_window", "width": 500, "height": 500
  }, "image": { "src": "Images/Sun.png", "name": "sun1", "hOffset": 250, "vOffset": 250,
  },
 }
}

是不是很清晰，一目了然，只要我們實現(xiàn)約定好文本的結(jié)構(gòu)(也就是語法)，那么client和server就能利用這種文本進行信息的編碼以及解碼，不管client和server是運行在x86還是Arm、是32位的還是64位的、運行在Linux上還是windows上、是大端還是小端，都可以無障礙交流。

因此在這里，文本的語法就是一種協(xié)議。順便說一句，你都規(guī)定好了文本的語法，實際上就相當(dāng)于發(fā)明了一種語言。

這里用來舉例用的語言就是所謂的Json，只不過json這種語言不是用來表示邏輯(代碼)而是用來存儲數(shù)據(jù)的。

Json就是這個老頭提出來的：

除了Json，另一種利用文本存儲數(shù)據(jù)的表示方法是XML，來一段感受下：

ToveJaniReminderDon't forget me this weekend!

相對Json來說是不是就沒那么容易看懂了，Json出現(xiàn)后在web領(lǐng)域逐漸取代了XML。

當(dāng)兩段數(shù)據(jù)量很少的時候——就像瀏覽器和服務(wù)端的交互，Json可以工作的非常好，這個場景就是這里：在這里是json的天下。

但對于后端服務(wù)之間的交互來說就不一樣了，后端服務(wù)之間的RPC調(diào)用可能會傳輸大量數(shù)據(jù)，如果全部用純文本的形式來表示數(shù)據(jù)那么不管是網(wǎng)絡(luò)帶寬還是性能可能都會差強人意。

在這種場景下，Json并不是最好的選項，主要原因之一就在于性能以及數(shù)據(jù)的體積。

我們知道，文本表示對人類是最友好的，對機器來說則不是這樣，對機器來說最好的還是01二進制。

那么有沒有二進制的編碼方法嗎？答案是肯定的，這就是當(dāng)前互聯(lián)網(wǎng)后端中流行的protobuf，Google公司開源項目。

那么protobuf有什么神奇之處嗎？

假設(shè)client端想給server端傳輸這樣一段信息：“我有一個id，其值為43”，那么在XML下是這樣表示的：

數(shù)一數(shù)這這段數(shù)據(jù)占據(jù)了多少字節(jié)，很顯然是11字節(jié)；

而如果用json來表示呢？

{"id":43}

數(shù)一數(shù)這段數(shù)據(jù)占據(jù)了多少字節(jié)，顯然是9字節(jié)；

而如果用protobuf來表示呢? 是這樣的：

// 消息定義
message Msg {
  optional int32 id = 1;
}

// 實例化
Msg msg;
msg.set_id(43);

其中Msg的定義看上去比Json和XML更加復(fù)雜了，但這些只是給人看的，這些還會被protbuf進一步處理，最終被編碼為：

082b

也就是0x08與0x2b，這占據(jù)了多少字節(jié)呢？答案是2字節(jié)。

從json的9字節(jié)到protobuf的2字節(jié)，數(shù)據(jù)大小減少了4倍多，數(shù)據(jù)量的減少意味著：

更少的網(wǎng)絡(luò)帶寬
更快的解析速度

那么protobuf是怎樣做到這一點的呢？

protobuf是怎樣實現(xiàn)的？

首先，我們來思考最簡單的情況，該怎樣表示數(shù)字。

你可能會想這還不簡單，統(tǒng)一用固定長度，比如用64個比特(8字節(jié))，這種方法可行，但問題是不論一個數(shù)字有多小，比方2，那么用這種方法表示2也需要占據(jù)64個比特(8字節(jié))：

明明只要一個字節(jié)就能表示而我們卻用了8個，前面的全都是0，這也太奢侈太浪費了吧。

顯然，在這里我們不能使用固定長度來表示數(shù)字，而需要使用變長方法來表示。

什么叫變長？意思是說如果數(shù)字本身比較大，那么其使用的比特位可以較多，但如果數(shù)字很小那么就應(yīng)該使用較少的比特位來表示，這就叫變長，隨機應(yīng)變，不死板。

那怎樣變長呢？

我們規(guī)定：對于每一個字節(jié)來說，第一個比特位如果是1那么表示接下來的一個比特依然要用來解釋為一個數(shù)字，如果第一個比特為0，那么說明接下來的一個字節(jié)不是用來表示該數(shù)字的。

也就是說對于每個8個比特(1字節(jié))來說，它的有效載荷是7個比特，第一個比特僅僅用來標(biāo)記是否還應(yīng)該把接下來的一個字節(jié)解析為數(shù)字。

根據(jù)這個規(guī)定假設(shè)來了這樣一串01二進制：

1010110000000010

根據(jù)規(guī)定，我們首先取出第一個字節(jié)，也就是：

10101100

此時我們發(fā)現(xiàn)第一個比特位是1，因此我們知道接下來的一個字節(jié)也屬于該數(shù)字，將當(dāng)前字節(jié)的1去掉就是：

然后我們看下一個字節(jié)：

00000010

我們發(fā)現(xiàn)第一個bit為0，因此我們知道下一個字節(jié)不屬于該數(shù)字了。

接下來我們將解析到的0101100(第一個字節(jié)去掉第一個比特位)以及第二個字節(jié)0000010(第二個字節(jié)去掉第一個比特位)翻轉(zhuǎn)之后拼接到一起，這里之所以翻轉(zhuǎn)是因為我們規(guī)定數(shù)字的高位在后。

這個過程就是：

1010110000000010  
->  10101100 | 00000010 // 解析得到兩個字節(jié)
    _          _
 
->  0101100  |  0000010  // 各自去掉最高位 
->  0000010  |  0101100  // 兩個字節(jié)翻轉(zhuǎn)順序

    0000010  +  0101100
->  100101100           // 拼接

最后我們得到了100101100，這一串二進制表示數(shù)字300。

這種數(shù)字的變長表示方法在protobuf中被稱之為varint。

因此在這種表示方法下，如果數(shù)字較大，那么使用的比特就多，如果數(shù)字較小那么使用比特就少，聰明吧。

有的同學(xué)看到這里可能會問題，剛才講解的方法只能表示無符號數(shù)字，那么有符號數(shù)字該怎么表示呢？比如-2該怎么表示？

有符號數(shù)的表示

按照剛才變長編碼的思想，-2147483646使用的比特位應(yīng)該比-2要少。

然而我們知道在計算機世界中負(fù)數(shù)使用補碼表示的，也就是說最高位(最左側(cè)的比特位)一定是1，假設(shè)我們使用64位來表示數(shù)字，那么如果我們依然用補碼來表示數(shù)字的話那么無論這個負(fù)數(shù)有多大還是多小都需要占據(jù)10個字節(jié)的空間。

為什么是10個字節(jié)呢？

不要忘了varint每個字節(jié)的有效負(fù)荷是7個比特，那么對于需要64位表示的數(shù)字來說就需要64/7向上取整也就是10個字節(jié)來表示。

這顯然不能滿足我們對數(shù)字變長存儲的要求。

該怎么解決這個問題呢？

既然無符號數(shù)字可以方便的進行變長編碼，那么我們將有符號數(shù)字映射稱為無符號數(shù)字不就可以了，這就是所謂的ZigZag編碼，是不是很聰明，就像這樣：

原始信息      編碼后
0            0 
-1           1 
1            2
-2           3
2            4
-3           5
3            6

...          ...

2147483647   4294967294
-2147483648  4294967295

這樣我們就可以將有符號數(shù)字轉(zhuǎn)為無符號數(shù)字，接收方接收到該數(shù)據(jù)后再恢復(fù)出有符號數(shù)字。

現(xiàn)在數(shù)字的問題徹底解決了，但這僅僅是萬里長征第一步。

字段名稱與字段類型

對于任何一個有用的信息都包含這樣幾部分：

字段名稱
字段類型
字段值

就像C/C++中定義變量時：

int i = 100;

在這里，字段名稱就是i，字段類型是int，字段值是100。

剛才我們用varint以及ZigZag編碼解決了字段值表示的問題，那么該怎樣表示字段名稱和字段類型呢？

首先，對于字段類型還比較簡單，因為字段類型就那么多，protobuf中定義了6種字段類型：

對于6種字段類型我們使用3個比特位來表示就足夠了。

接下來比較有趣的是字段名稱該怎么表示呢？假設(shè)我們需要傳遞這樣一個字段：

int long_long_name = 100;

那么我們真的需要把“l(fā)ong_long_name”這么多字符通過網(wǎng)絡(luò)傳遞給對端嗎？

既然通信雙方需要協(xié)議，那么“l(fā)ong_long_name”這字段其實是client和server都知道的，它們唯一不知道的就是“哪些值屬于哪些字段”。

為解決這個問題，我們給每個字段都進行編號，比如通信雙方都知道“l(fā)ong_long_name”這個字段的編號是2，那么對于：

int long_long_name = 100;

這個信息我們只需要傳遞：

字段名稱：2 (2對應(yīng)字段“l(fā)ong_long_name”)
字段類型：0 (0表示varint類型，參見上圖)
字段值：100

所以我們可以看到，無論你用多么復(fù)雜的字段名稱也不會影響編碼后占據(jù)的空間，字段名稱根本就不會出現(xiàn)在編碼后的信息中，so clever。

從宏觀上看

我們已經(jīng)在protobuf中看到了數(shù)字以及字段名稱以及字段類型是怎么表示了，現(xiàn)在是時候從宏觀角度來看看多個字段該怎么編碼了。

從本質(zhì)上講，protobuf被編碼后形成一系列的key-value，每個key-value對應(yīng)一個proto中的字段。

也就是鍵值對：

其中value比較簡單，也就是字段值；而字段名稱和字段類型會被拼接成key，protobuf中共有6種類型，因此只需要3個比特位即可；字段名稱只需要存儲對應(yīng)的編號，這樣可以就可以這樣編碼：

(字段編號 << 3) | 字段類型

假設(shè)server接收到了一個key為0x08，其二進制的表示為：

0000 1000

由于key也是利用varint編碼的，因此需要將第一個比特位去掉，這樣我的得到：

000 1000

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

MATLAB 助力香港中文大學(xué)解決生物醫(yī)學(xué)圖像處理挑戰(zhàn)

中國北京，2025 年 8 月 28 日 —— 全球領(lǐng)先的數(shù)學(xué)計算軟件開發(fā)商 MathWorks 今日宣布，香港中文大學(xué)(下文簡稱：港中大)一支研究團隊采用 MATLAB?、Medical Imaging Toolbo...

關(guān)鍵字：生物醫(yī)學(xué) 計算機

[NVIDIA]

基于 NVIDIA Blackwell 的 Jetson Thor 現(xiàn)已發(fā)售，加速通用機器人時代的到來

加利福尼亞州圣克拉拉 — 2025 年 8 月 25 日 — NVIDIA 今日宣布 NVIDIA Jetson AGX Thor? 開發(fā)者套件和量產(chǎn)級模組現(xiàn)已發(fā)售。這是一款功能強大的新一代機器人計算機，旨在為制造、物流...

關(guān)鍵字：機器人計算機 AI

[美通社全球TMT]

軟通華方：傳承清華同方基因，以FunAI3戰(zhàn)略智啟華章

北京2025年8月18日 /美通社/ -- 2025年8月，軟通動力集團一項關(guān)鍵決策引發(fā)行業(yè)矚目——以自有資金8億元向全資子公司軟通計算機有限公司完成實繳增資，使其注冊資本增加至23億元。這筆戰(zhàn)略注資不僅彰顯集團對信創(chuàng)核...

關(guān)鍵字： AI 硬件計算機智能化

[美通社全球TMT]

TOP3！軟通計算機入選2025中國信創(chuàng)PC十大市場影響力品牌

北京2025年7月31日 /美通社/ -- 近日，權(quán)威咨詢機構(gòu)德本咨詢重磅發(fā)布"2025中國信創(chuàng)PC市場影響力品牌TOP 10"榜單。軟通計算機憑借其迅猛的發(fā)展勢頭、領(lǐng)先的技術(shù)整合能力及顯著的市場表現(xiàn)...

關(guān)鍵字：計算機 TOP PC PC市場

[電路設(shè)計項目集錦]

M5Stack計算機的終極遙控器

我想把整個紅外數(shù)據(jù)庫，數(shù)千個遠(yuǎn)程文件分布在數(shù)百個文件夾中，打包到一個手持設(shè)備中。

關(guān)鍵字：紅外通信 M5Stack 計算機

[技術(shù)解析]

如何選擇工控機？工控機3點選擇建議分享

工控機，全稱為工業(yè)控制計算機，是一種專為工業(yè)環(huán)境設(shè)計并制造的計算機設(shè)備。為增進大家對工控機的認(rèn)識，本文將對工控機的選擇方法予以介紹，以便大家在選擇工控機時有所依據(jù)。如果你對工控機具有興趣，不妨繼續(xù)往下閱讀哦。

關(guān)鍵字：工控機指數(shù) 計算機

[技術(shù)解析]

工控機如何編程？工控機是如何控制設(shè)備的？

為增進大家對工控機的認(rèn)識，本文將對工控機的變成方法以及工控機對設(shè)備的控制予以介紹。

關(guān)鍵字：工控機指數(shù) 計算機

[通信先鋒]

世界首臺非硅二維材料計算機問世：有助造出更薄更節(jié)能電子產(chǎn)品

6月12日消息，據(jù)媒體報道，美國賓夕法尼亞州立大學(xué)領(lǐng)導(dǎo)的研究團隊首次利用二維材料成功制造出一臺可執(zhí)行簡單操作的計算機。這一突破為開發(fā)更薄、更快、更節(jié)能的電子產(chǎn)品奠定了重要基礎(chǔ)。

關(guān)鍵字：非硅二維材料計算機

[美通社全球TMT]

環(huán)旭電子與客戶攜手推出高性能專業(yè)自行車計算機

上海 2025年6月4日 /美通社/ -- 環(huán)旭電子作為全球電子設(shè)計與制造服務(wù)領(lǐng)導(dǎo)廠商，近年來透過聯(lián)合設(shè)計制造服務(wù)模式（Joint Design Manufacturing，JDM），協(xié)助知名品牌客戶開發(fā)出兼具強固性與...

關(guān)鍵字：電子計算機 BSP DESIGN

[美通社全球TMT]