當(dāng)前位置：首頁 > 芯聞號(hào) > 充電吧

win和linux平臺(tái)下C++ 字符串的編碼分享

時(shí)間：2018-11-02 14:54:01

關(guān)鍵字： c++ Linux Windows

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]windows平臺(tái)　　　　　　　　　　char 表示單字符，占用一個(gè)字節(jié)　　　　　　　　wchar_t 表示寬字符，占用兩個(gè)字節(jié)Linux平臺(tái)　　　　　　　　　　　char 占用一個(gè)字節(jié) 　　　　　　

windows平臺(tái)　　

　　　　　　　　char 表示單字符，占用一個(gè)字節(jié)

　　　　　　　　wchar_t 表示寬字符，占用兩個(gè)字節(jié)

Linux平臺(tái)　　　

　　　　　　　　char 占用一個(gè)字節(jié)
　　　　　　　　wchar_t 占用四個(gè)字節(jié)

windows平臺(tái)下對(duì)于用字符串保存中文的問題，GBK和UTF8都是用char來表示，只是為了表示一個(gè)中文字符需要用到多個(gè)char。而對(duì)于UNICODE（其實(shí)應(yīng)該說是UFT16），每一個(gè)字符都需要一個(gè)兩個(gè)字節(jié)，也就是用wchar_t表示。

UNICODE只是一個(gè)字符集，規(guī)定了不同的字符對(duì)應(yīng)于一個(gè)唯一的整數(shù)，平時(shí)所說的使用UNICODE編碼其實(shí)說的是UFT16編碼（顧名思義就是用16位來表示一個(gè)字符）。

UTF8、UTF16和UFT32則是基于UNICODE字符集的三種編碼方式。不同之處是：對(duì)于一個(gè)字符所對(duì)應(yīng)的整數(shù)，應(yīng)該怎樣用二進(jìn)制位表示出來。對(duì)于UTF16和UTF32，不管字符對(duì)應(yīng)的數(shù)字是多少，都用恒定的多字節(jié)表示，所以可以很方便的表示一個(gè)字符，但需要注意字節(jié)序問題。比較麻煩的是UFT8，對(duì)于不同的字符，可能會(huì)用到一個(gè)字節(jié)，兩個(gè)字節(jié)到最多六個(gè)字節(jié)。這么做的好處是節(jié)省了空間。

在實(shí)際使用字符串保存時(shí)，因?yàn)閁TF16不管什么字符，都用2個(gè)字節(jié)表示，所以可能會(huì)出現(xiàn)某一個(gè)字節(jié)全零的情況。例如字符‘A’編碼是0x41，用UTF16表示就是0x0041。對(duì)于char表示的字符串，以0x00表示結(jié)尾，所以沒有辦法正確的存儲(chǔ)此類數(shù)據(jù)，此時(shí)只能用wchar_t來保存。

UTF8編碼方式如下：用1~6個(gè)字節(jié)存儲(chǔ)一個(gè)字符，當(dāng)?shù)谝粋€(gè)字節(jié)的首位為0時(shí)，表示這個(gè)字符只用一個(gè)字節(jié)表示（剛好與ASCII碼一一對(duì)應(yīng)），當(dāng)用多字節(jié)表示一個(gè)字符時(shí)，首字節(jié)以連續(xù)的多個(gè)1和一個(gè)0開始，表示用多個(gè)字節(jié)。例如用3個(gè)字節(jié)是，首字節(jié)為1110xxxx，后面各字節(jié)均以10開始。

UNICODE原碼（16進(jìn)制） UTF8（2進(jìn)制）
0000-007F 0xxxxxxx
0080-07FF 110xxxxx 10xxxxxx
0800-FFFF 1110xxxx 10xxxxxx 10xxxxxx
……

如上所示，UTF8中的‘x’就是實(shí)際表示字符編碼的位。表示的最大值就是全1的情況，最小值就是少一個(gè)字節(jié)的情況下最大值加1，因?yàn)樯僖粋€(gè)字節(jié)已經(jīng)可以存的下的字符，不會(huì)用多一個(gè)字節(jié)來保存。由上可知，UTF8可以直接用char類型的字符串來表示，只是用對(duì)應(yīng)的解釋方式來解釋就可以正確顯示了。

另外一種就是GBK等編碼方式。這一類編碼方式和UNICODE沒有任何關(guān)系，是另一種字符集和編碼方式的規(guī)定。使用方法可以類比于UTF8，在編碼小于128時(shí)，就是ASCII，而中文的編碼均大于128，用超過一個(gè)字節(jié)來表示。在平時(shí)編寫的windows程序中，可以理解為如果使用了UNICODE宏，就是在用wchar_t來表示中文，使用UTF16編碼，如果沒有UNICODE宏，那么就是在用GBK，以char來表示中文。

windows平臺(tái)下的TCHAR類型就是通過宏對(duì)char和wchar_t的封裝?？筛鶕?jù)當(dāng)前平臺(tái)情況選擇對(duì)應(yīng)的類型。_T修飾的字符串常量同理，根據(jù)是否定義的UNICODE宏，分別表示”“或L”“。

Linux平臺(tái)的不同在于，wchar_t用4個(gè)字節(jié)表示，也就是UCS-4，而windows用兩個(gè)字節(jié)，UCS-2。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場，使汽車開發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運(yùn)營商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡稱"軟通動(dòng)力"）與長三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)