今天在作項目時,遇到了將客戶添加的商品的名稱轉換成拼音碼的需求,雖然公司有現成的拼音碼數據庫表,但發現不夠全,並且使用的時候爲了獲得一個字符串的拼音碼要頻繁的查詢數據庫。因此想用其它的辦法來完成需求,後來 Google 了一番,雖然找到一些別人寫的工具類,但發現要麼沒法支持UTF-8編碼的漢字的轉換,要麼就是遇到字符串中包含非漢字時就會出錯,後來找到了一篇 blog,但發現與個人需求還有一些誤差,因而本身又在上面的基礎上進行了修改,現附上源碼,但願能夠幫到哪些遇到和我同樣需求的朋友們。(須要pinyin4j.jar支持,沒找到添加附件的功能,須要的話,能夠去下面這個地址下載)java
本文參考了另外一篇 blog :http://my.oschina.net/tiancai/blog/93751 數據庫
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
/**
* java漢字轉拼音操做工具類,如包含非漢字則不對其轉換,直接跳過
*/
public class PinYinMaUtil {
/**
* 將字符串轉換成拼音數組
* @param str 待轉換的漢字字符串
* @param onlyFirst 是否只取每一個漢字對應的拼音的首字母
* @return 轉換成拼音碼的字符串
*/
public static String stringToPinyin(String str,boolean onlyFirst) {
return stringToPinyin(str,onlyFirst, false, null);
}
/**
* 將字符串轉換成拼音數組
* @param str 待轉換的漢字字符串
* @param onlyFirst 是否只取每一個漢字對應的拼音的首字母
* @return 轉換成拼音碼的字符串
*/
public static String stringToPinyin(String str,boolean onlyFirst,String separator) {
return stringToPinyin(str,onlyFirst, true, separator);
}
/**
* 將字符串轉換成拼音數組
* @param str 待轉換的漢字字符串
* @param isPolyphone 是否查出多音字的全部拼音
* @param separator 多音字拼音之間的分隔符
* @return
*/
public static String stringToPinyin(String str,boolean onlyFirst, boolean isPolyphone,
String separator) {
// 判斷字符串是否爲空
if ("".equals(str) || null == str) {
return null;
}
char[] strChar = str.toCharArray();
int strCount = strChar.length;
StringBuffer sb = new StringBuffer();
String temp = null;
for (int i = 0; i < strCount; i++) {
temp = charToPinyin(strChar[i], isPolyphone, separator);
if(onlyFirst){
sb.append( temp.substring(0, 1));
}else{
sb.append(temp);
}
}
return sb.toString();
}
/**
* 將單個字符轉換成拼音
* @param str 待轉換的漢字字符串
* @return 轉換成拼音碼後的字符串
*/
public static String charToPinyin(char str, boolean isPolyphone,
String separator) {
// 建立漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設置,大小寫,音標方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
StringBuffer tempPinying = new StringBuffer();
// 若是是中文
if (str > 128) {
try {
// 轉換得出結果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(str,
defaultFormat);
// 是否查出多音字,默認是查出多音字的第一個字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之間用特殊符號間隔起來
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(str);
}
return tempPinying.toString();
}
public static String hanziToPinyin(String hanzi){
return hanziToPinyin(hanzi," ");
}
/**
* 將漢字轉換成拼音
* @param hanzi
* @param separator
* @return
*/
@SuppressWarnings("deprecation")
public static String hanziToPinyin(String hanzi,String separator){
// 建立漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設置,大小寫,音標方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
// defaultFormat.setVCharType(HanyuPinyingVCharType);
String pinyingStr="";
try {
pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
return pinyingStr;
}
/**
* 將字符串數組轉換成字符串
* @param str
* @param separator 各個字符串之間的分隔符
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 簡單的將各個字符數組之間鏈接起來
* @param str
* @return
*/
public static String stringArrayToString(String[] str){
return stringArrayToString(str,"");
}
/**
* 將字符數組轉換成字符串
* @param str
* @param separator 各個字符串之間的分隔符
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 將字符數組轉換成字符串
* @param str
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch," ");
}
/**
* 取漢字的首字母
* @param str
* @param isCapital 是不是大寫
* @return
*/
public static char[] getHeadByChar(char str,boolean isCapital){
//若是不是漢字直接返回
if (str <= 128) {
return new char[]{str};
}
//獲取全部的拼音
String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(str);
//建立返回對象
int polyphoneSize=pinyingStr.length;
char [] headChars=new char[polyphoneSize];
int i=0;
//截取首字符
for(String s:pinyingStr){
char headChar=s.charAt(0);
//首字母是否大寫,默認是小寫
if(isCapital){
headChars[i]=Character.toUpperCase(headChar);
}else{
headChars[i]=headChar;
}
i++;
}
return headChars;
}
/**
* 取漢字的首字母(默認是大寫)
* @param str
* @return
*/
public static char[] getHeadByChar(char str){
return getHeadByChar(str,true);
}
/**
* 查找字符串首字母
* @param str
* @return
*/
public static String[] getHeadByString(String str){
return getHeadByString( str, true);
}
/**
* 查找字符串首字母
* @param str
* @param isCapital 是否大寫
* @return
*/
public static String[] getHeadByString(String str,boolean isCapital){
return getHeadByString( str, isCapital,null);
}
/**
* 查找字符串首字母
* @param str
* @param isCapital 是否大寫
* @param separator 分隔符
* @return
*/
public static String[] getHeadByString(String str,boolean isCapital,String separator){
char[]chars=str.toCharArray();
String[] headString=new String[chars.length];
int i=0;
for(char ch:chars){
char[]chs=getHeadByChar(ch,isCapital);
StringBuffer sb=new StringBuffer();
if(null!=separator){
int j=1;
for(char ch1:chs){
sb.append(ch1);
if(j!=chs.length){
sb.append(separator);
}
j++;
}
}else{
sb.append(chs[0]);
}
headString[i]=sb.toString();
i++;
}
return headString;
}
public static void main(String[] args) {
System.out.println(hanziToPinyin("是都就寫",""));
String pym =stringToPinyin("的8說法'()[]是",false);
System.out.println(pym);
}
}
api