再議字符集和編碼

    首先需要弄清楚,字符集(character set)和encode是兩個不同概念。 Character Set 表明的是一個字符集合,它經常由國家或者國際標準組織來規定,例如GB2312它是一個字符集。理論上講,它在實現上可以使用2字節,或者4字節進行編碼,只要encode能夠表達所有GB2312的字符即可。 Encode 表明的是編碼方式,理論上,同一個字符集可以有多種不同的編碼方式,多
相關文章
相關標籤/搜索