簡單測試--C#實現中文漢字轉拼音首字母

第一種:html

這個是本身寫的比較簡單的實現方法,要作漢字轉拼音首字母,首先應該有一個存儲首字母的數組,而後將要轉拼音碼的漢字與每一個首字母開頭的第一個漢字即「最小」的漢字做比較,這裏的最小指的是按拼音規則比較最小,例如a比h小,因此「愛」比「恨」小,同一個字母開頭的拼音比較大小以此類推。最後實現的結果是隻轉漢字,對於中文特殊字符、標點符號和英文都原樣輸出,不轉碼。正則表達式

實現方法以下:數組

 1 using System;
 2 using System.Collections.Generic;
 3 using System.Globalization;
 4 using System.Linq;
 5 using System.Text;
 6 using System.Threading.Tasks;
 7 using System.Text.RegularExpressions;//先導入這個使用正則表達式
 8 
 9 namespace WritePinYin
10 {
11 
12     public class SimplePinYin
13     {
14         //漢字每一個首字母的拼音中最小的字,順序不能亂
15         private static char[] firstcn = { '', '', '', '', '', '', '', '',
16                                    '', '', '', '', '', '', '', '',
17                                    '', '', '', '', '', '', '' };
18         //全部漢字首字母
19         private static char[] firsten = { 'Z', 'Y', 'X', 'W', 'T', 'S', 'R', 'Q',
20                                    'P', 'O', 'N', 'M', 'L', 'K', 'J', 'H',
21                                    'G', 'F', 'E', 'D', 'C', 'B', 'A' };
22 
23         /// <summary> 
24         /// 漢字轉化爲拼音首字母
25         /// </summary> 
26         /// <param name="str">漢字</param> 
27         /// <returns>首字母</returns> 
28         public static string GetFirstPinyin(string strcn)
29         {
30             int intlen = strcn.Length;
31             int index = 0;
32             char chartemp = char.MinValue;
33             string strtemp = string.Empty;
34             Regex reg = new Regex(@"[\u4e00-\u9fa5]");//\u4e00-\u9fa5用來判斷是否是中文的正則表達式
35             CultureInfo pinyin = new CultureInfo(0x804);//保存區域特定的信息,如關聯的語言、子語言、國家/地區、日曆和區域性約定,這裏表示中文
36             if (intlen > 0)
37             {
38                 char[] strchar = new char[intlen + 1];
39                 for (int i = 0; i < intlen; i++)
40                 {
41                     strchar[i] = Convert.ToChar(strcn.Substring(i, 1));
42                 }
43                 foreach (char cstr in strchar)
44                 {
45                     chartemp = char.MinValue;
46                     if (reg.IsMatch(cstr.ToString()))//對於中文漢字,不包括中文特定字符
47                     {
48                         foreach (char fstr in firstcn)
49                         {
50                             if (string.Compare(cstr.ToString(), fstr.ToString(), pinyin, CompareOptions.None) >= 0)//將漢字與設定的漢字按拼音比較大小
51                             {
52                                 index = Array.IndexOf(firstcn, fstr);
53                                 chartemp = firsten[index];
54                                 break;
55                             }
56                         }
57                     }
58                     else//對於非中文漢字,不做拼音碼處理
59                     {
60                         chartemp = cstr;
61                     }
62                     strtemp += chartemp;
63                 }
64             }
65             return strtemp;
66         }
67 
68     }
69 }

調用:Console.WriteLine("{0}:{1}", strcn, SimplePinYin.GetFirstPinyin("我是托爾其!"));spa

第二種:操作系統

參考:http://www.cnblogs.com/yazdao/archive/2011/06/04/2072488.htmlcode

使用微軟的Visual Studio International Pack 類庫提取漢字拼音首字母,首先下載Visual Studio International Pack 1.0,官方下載地址:http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=44CAC7F0-633B-477D-AED2-99AEE642FC10&displaylang=zh-cn。下載完畢後解壓,解壓後能夠發現7個MSI安裝文件,其中CHSPinYinConv.msi是漢字拼音組件,CHTCHSConv.msi是進行繁簡體互轉組件,安裝這兩個MSI就能夠了 (x86操做系統上的默認安裝目錄是 C:\Program Files\Microsoft Visual Studio International Pack\) 。安裝完畢後,須要在VS裏添加引用,分別引用:C:\Program Files\Microsoft Visual Studio International Pack\Simplified Chinese Pin-Yin Conversion Library(拼音)下和C:\Program Files\Microsoft Visual Studio International Pack\Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool(繁簡互轉)下的dll 便可使用。htm

 1 using Microsoft.International.Converters.PinYinConverter;//導入拼音相關
 2 
 3 namespace WebApplication2
 4 {
 5     public class Class1
 6     {   
 7         /// <summary> 
 8         /// 漢字轉化爲拼音
 9         /// </summary> 
10         /// <param name="str">漢字</param> 
11         /// <returns>全拼</returns> 
12         public static string GetPinyin(string str)
13         {
14             string r = string.Empty;
15             foreach (char obj in str)
16             {
17                 try
18                 {
19                     ChineseChar chineseChar = new ChineseChar(obj);
20                     string t = chineseChar.Pinyins[0].ToString();
21                     r += t.Substring(0, t.Length - 1);
22                 }
23                 catch
24                 {
25                     r += obj.ToString();
26                 }
27             }
28             return r;
29         }
30 
31         /// <summary> 
32         /// 漢字轉化爲拼音首字母
33         /// </summary> 
34         /// <param name="str">漢字</param> 
35         /// <returns>首字母</returns> 
36         public static string GetFirstPinyin(string str)
37         {
38             string r = string.Empty;
39             foreach (char obj in str)
40             {
41                 try
42                 {
43                     ChineseChar chineseChar = new ChineseChar(obj);
44                     string t = chineseChar.Pinyins[0].ToString();
45                     r += t.Substring(0, 1);
46                 }
47                 catch
48                 {
49                     r += obj.ToString();
50                 }
51             }
52             return r;
53         }
54     }
55 }

調用:Console.WriteLine("{0}:{1}", strcn, MSPinyin.GetFirstPinyin("我是托爾其!"));blog

相關文章
相關標籤/搜索