編碼方式ASCII、GBK、Unicode、UTF-8比較

 

文章內容深度較淺,詳細瞭解可到下連接:https://blog.csdn.net/QuinnNorris/article/details/78705723;ui

總結了如下幾種編碼方式:編碼

ASCII、GBK(GB23十二、GB18030)、Unicode、UTF-8spa

1.1.ASCII.net

American Standard Code for Information Interchangecode

最先的編碼,一個字符一個字節。沒有中文字符,用這個編譯中文就會亂碼。orm

一個字節8個比特,最多表示127個字符,2^7=128,7位編碼。blog

後來有個擴展的,有256個字符,但不是國際標準。get

1.2.GBK、GB23十二、GB18030io

中文編碼,兩個字節,第一個字節最高位是1。編譯

不一樣國家各有標準,如,日文:Shift_JIS、韓文:Euc-kr。

1.3.Unicode

全球統一編碼,包含全部國家語言的字符。
2字節,英文第一個字節是0,因此大量英文字會浪費空間。

1.4.UTF-8

變長編碼,靈活「容錯率」強,可爲1字節可爲2字節,1-4字節。

英文上,UTF-8與ASCII同樣。

中文用了三個字節。

單字節0開頭,雙字節110..10..開頭,三字節1110..10..10..開頭。

相關文章
相關標籤/搜索