編碼相關

位(bit):數據存儲的最小單位。表示二進制位、每一個二進制數字0或者1就是1個位
字(word):1字=2字節(1 word = 2 byte)
字節(byte):8個位構成一個字節;即:1byte(字節)=8bit(位);計算機中存儲數據的單元,一個8位的二進制數,是一個很具體的存儲空間。
1 KB = 1024 B(字節);
1 MB = 1024 KB;   (2^10 B)
1 GB = 1024 MB;  (2^20 B)
1 TB = 1024 GB;   (2^30 B)
字符:a、A、中、+、*、の......均表示一個字符;人們使用的記號,抽象意義上的一個符號。
通常 utf-8 編碼下,一個漢字 字符 佔用 3 個 字節;
通常 gbk 編碼下,一個漢字 字符 佔用 2 個 字節;
字符集:即各類各個字符的集合,也就是說哪些漢字,字母(A、b、c)和符號(空格、引號..)會被收入標準中;
base64爲一種字符集、標準ASCii字符集、擴展ASCii字符集、gbk字符集、瀏覽器

編碼:規定每一個「字符」分別用一個字節仍是多個字節存儲,用哪些字節來存儲,這個規定就叫作「編碼」。(其實際是對字符集中字符進行編碼,即:每一個字符用二進制在計算中表示存儲);
通俗的說:編碼就是按照規則對字符進行翻譯成對應的二進制數,在計算器中運行存儲,用戶看的時候(好比瀏覽器),在用對應的編碼解析出來用戶能看懂的;

Unicode字符集:容納世界上全部語言字符和符號的集合(以及對應的二進制數字)
Unicode只是一個編碼規範,目前實際實現的unicode編碼只要有三種:UTF-8,UCS-2和UTF-16,三種unicode字符集之間能夠按照規範進行轉換。
UTF-8是一種針對Unicode的可變長度字符編碼,也是一種前綴碼。網絡

bps 是 bits per second 的簡稱。通常數據機及網絡通信的傳輸速率都是以「bps」爲單位。如56Kbps、100.0Mbps 等等。
Bps便是Byte per second 的簡稱。而電腦通常都以Bps 顯示速度,如1Mbps 大約等同 128 KBps。
bit 電腦記憶體中最小的單位,在二進位電腦系統中,每一bit 能夠表明0 或 1 的數位訊號。
Byte一個Byte由8 bits 所組成,可表明一個字元(A~Z)、數字(0~9)、或符號(,.?!%&+-*/),是記憶體儲存資料的基本單位,至於每一箇中文字則需要兩Bytes。當記憶體容量過大時,位元組這個單位就不夠用,所以就有千位元組的單位KB出現,如下乃個記憶體計算單位之間的相關性:編碼

相關文章
相關標籤/搜索