什麼是Unicode letter

原由:從一段代碼提及html

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace Test
{
    class Program
    {
        static void Main(string[] args)
        {
            string temp = "1610MM001A衫片";
            foreach (Char item in temp)
            {
                if (char.IsLetter(item))
                {
                    Console.WriteLine(item);
                }
            }
            Console.ReadKey();
            
        }
    }
}

這段代碼的輸出  spa

本來覺得是「MMA」,爲何漢子「衫片」也是?code

F12,看一下orm

那麼什麼是Unicode(參見http://www.cnblogs.com/John-Marnoon/p/5825906.html),htm

那麼,Unicode Letter都包括什麼呢?blog

首先,查一下微軟的Char.IsLetter 方法 (String, Int32)unicode

https://msdn.microsoft.com/zh-cn/library/zff1at55(v=vs.110).aspxstring

其次,看一下IsLetter的源代碼it

 

進一步看看CheckLetter方法io

 

 

大寫字母、小寫字母、標題字母(首字母大寫)、修飾語字母、其餘字母。

由於各個國家的語言都不同,例若有的語言是帶聲調的。因此僅從我的理解以及涉及到的應用範圍,這個unicode letter應該是全部漢字+英文字母,數字和符號大多不包括在內。

可是也有例外。。。。

 例以下面就會讓你蒙圈了。。。 哈哈哈

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;

namespace Test
{
    class Program
    {
        static void Main(string[] args)
        {
            bool a1 = char.IsLetter('!');
            bool a2 = char.IsLetter('ǃ');
            bool b1 = char.IsLetter('|');
            bool b2 = char.IsLetter('ǀ');

            Console.WriteLine(a1);
            Console.WriteLine(a2);
            Console.WriteLine(b1);
            Console.WriteLine(b2);
          Console.ReadKey();
        }
    }
}

若有錯誤,還請不吝指教。

附錄

這五類具體包括什麼,請查詢 http://www.fileformat.info/info/unicode/category/index.htm

相關文章
相關標籤/搜索