1. 計算機存的是二進制,咱們平時使用的漢字都不是二進制,存在計算機裏用的是字符編碼。編碼
2. 字符集就是一套文字符號及其編碼的描述。字符集有不少種。字符編碼
3. 概念:二進制
A. 位:計算機中的最小單位,二進制中的一位,用0/1表示。(比特)數據
B. 字節:八位組成一個字節。(一個漢字能夠是兩個或三個字節)英文
C. 字符:咱們肉眼可見的文字或符號。(一個漢字是一個字符,一個英文字母是一個字符)計算機
D. 字符集:字符的集合。集合
E. 編碼:將字符轉換成計算機能夠識別的0/1代碼。字符集
F. 解碼:將計算機表示的0/1編碼轉換成肉眼可見的字符。字符
4. 編碼:文字
ASCII:
GB2312:收錄7千多簡體漢字
GBK:收錄2萬多漢字(流行)
GB18030:另加了少數民族的文字
UCS:全部字符采用四個字節進行編碼,
UTF-8:對不一樣範圍的字符使用不一樣長度的編碼
UFT-16:以16位無符號整型數據爲單位的