UTF-8編碼下中文佔幾個字節

 

0utf-8

utf8是變長的,不是定長, ucs-4範圍是1~6字節, 決定一個utf8字長度得看它首個字符, CJK通常是3字節字符

2

utf-8是不定長的,根據左側位1的個數來決定佔用了幾個字節

false的:

 

utf-8能夠根據字的第一個字節移位推出長度的

0xxxxxxx

 

110xxxxx 10xxxxxx

1110xxxx 10xxxxxx 10xxxxxx

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

相關文章
相關標籤/搜索