iOS計算輸入字符數

iOS計算輸入字符數

本文展現在iOS下,如何正確的計算輸入的字符個數。數據庫

常見編碼

漢字、中文符號

UTF-8編碼下,一個漢字,包括中文符號標點,佔3個字節。 GBK、GB2312編碼下,是2個字節。編程

emoji表情

不管是UTF-8,仍是GBK、GB2312,emoji表情都是佔用4個字節。編碼

iOS的設備編碼

iOS的設備,基本上都是使用UTF-8編碼,因此一個漢字是3個字節。指針

現狀

一般狀況下,數據庫的存儲,會使用UTF-8編碼。 而咱們在編程時,會把一個漢字認爲是2個字節。code

結論

所以,咱們須要使用GBK的編碼,去判斷用戶輸入的字符個數,以做限制。字符串

一、獲取GBK編碼it

NSStringEncoding encoding = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);

二、使用GBK編碼做爲 cStringUsingEncoding 方法的編譯,來獲取字符串的cString首個字符指針。編譯

三、使用 lengthOfBytesUsingEncoding 獲取字節長度,而後遍歷,由此計算出全部字符長度。emoji

代碼示例

將如下代碼放入NSString的categorycoding

- (NSUInteger)charactorNumber
{
    NSStringEncoding encoding = CFStringConvertEncodingToNSStringEncoding(kCFStringEncodingGB_18030_2000);
    return [self charactorNumberWithEncoding:encoding];
}

- (NSUInteger)charactorNumberWithEncoding:(NSStringEncoding)encoding
{
    NSUInteger strLength = 0;
    char *p = (char *)[self cStringUsingEncoding:encoding];
    
    NSUInteger lengthOfBytes = [self lengthOfBytesUsingEncoding:encoding];
    for (int i = 0; i < lengthOfBytes; i++) {
        if (*p) {
            p++;
            strLength++;
        }
        else {
            p++;
        }
    }
    return strLength;
}
相關文章
相關標籤/搜索