C++裏將string類字符串(utf-8編碼)分解成單個字(可中英混輸)

 1)對於單字節的符號,字節的第一位設爲0,後面7位爲這個符號的unicode碼。所以對於英語字母,UTF-8編碼和ASCII碼是相同的。編碼   2)對於n字節的符號(n>1),第一個字節的前n位都設爲1,第n+1位設爲0,後面字節的前兩位一概設爲10。剩下的沒有說起的二進制位,所有爲這個符號的unicode碼。code   如表: utf-8 1字節 0xxxxxxx  2字節 110xxxx
相關文章
相關標籤/搜索