本文展現在iOS下,如何正確的計算輸入的字符個數。數據庫
UTF-8編碼下,一個漢字,包括中文符號標點,佔3個字節。 GBK、GB2312編碼下,是2個字節。編程
不管是UTF-8,仍是GBK、GB2312,emoji表情都是佔用4個字節。編碼
iOS的設備,基本上都是使用UTF-8編碼,因此一個漢字是3個字節。指針
一般狀況下,數據庫的存儲,會使用UTF-8編碼。 而咱們在編程時,會把一個漢字認爲是2個字節。code
所以,咱們須要使用GBK的編碼,去判斷用戶輸入的字符個數,以做限制。字符串
一、獲取GBK編碼it
NSStringEncoding encoding = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
二、使用GBK編碼做爲 cStringUsingEncoding
方法的編譯,來獲取字符串的cString首個字符指針。編譯
三、使用 lengthOfBytesUsingEncoding
獲取字節長度,而後遍歷,由此計算出全部字符長度。emoji
將如下代碼放入NSString的categorycoding
- (NSUInteger)charactorNumber { NSStringEncoding encoding = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000); return [self charactorNumberWithEncoding:encoding]; } - (NSUInteger)charactorNumberWithEncoding:(NSStringEncoding)encoding { NSUInteger strLength = 0; char *p = (char *)[self cStringUsingEncoding:encoding]; NSUInteger lengthOfBytes = [self lengthOfBytesUsingEncoding:encoding]; for (int i = 0; i < lengthOfBytes; i++) { if (*p) { p++; strLength++; } else { p++; } } return strLength; }