0utf-8
utf8是變長的,不是定長, ucs-4範圍是1~6字節, 決定一個utf8字長度得看它首個字符, CJK通常是3字節字符
2
utf-8是不定長的,根據左側位1的個數來決定佔用了幾個字節
false的:
utf-8能夠根據字的第一個字節移位推出長度的
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx