最近在作PC端網站的頁面的一個表單校驗,須要把全角輸入轉化成半角符號。以前沒有了解過這些編碼的知識,仍是得Google一下查查資料,故簡單總結一下。javascript
什麼是全角、半角
傳統上,英語或拉丁字母語言使用的電腦系統,每個字母或符號,都是使用一字節的空間(一字節由8比特組成,共256個編碼空間)來儲存;而漢語、日語及韓語文字,因爲數量大大超過256個,故慣常使用兩字節來儲存一個字符。在使用等寬字體(如DOS、部分文字編輯器等)的環境下,中日韓文字此時佔據兩倍於西文字符的顯示寬度。因此,中、日、韓等文字稱爲全角字符,相比起來,拉丁字母或數字就稱爲半角字符。有時爲了使字體看起來齊整,英文字母、數字及其餘符號也由原來只佔一個字空間,改成佔用兩個字的空間顯示、使用兩個字節儲存的格式。(維基百科)html
轉化原理
- 全角空格unicode編碼爲12288,半角空格爲32
- 其餘字符半角(33-126)與全角(65281-65374)的unicode編碼對應關係是:均相差65248
全角轉半角
function ToCDB(str) {
var tmp = "";
for (var i = 0; i < str.length; i++) {
if (str.charCodeAt(i) > 65248 && str.charCodeAt(i) < 65375) {
tmp += String.fromCharCode(str.charCodeAt(i) - 65248);
}
else {
tmp += String.fromCharCode(str.charCodeAt(i));
}
}
return tmp
}
半角轉全角
function ToDBC(txtstring) {
var tmp = "";
for (var i = 0; i < txtstring.length; i++) {
if (txtstring.charCodeAt(i) == 32) {
tmp = tmp + String.fromCharCode(12288);
}else if (txtstring.charCodeAt(i) < 127) {
tmp = tmp + String.fromCharCode(txtstring.charCodeAt(i) + 65248);
}
}
return tmp;
}
參考
全角半角區別java