Java實現過濾中文亂碼

最近在日誌數據清洗時遇到中文亂碼,若是隻要有非中文字符就將該字符串過濾掉,這種方法雖簡單但並不可取,由於好比像Xperia™主題、每天四川麻將Ⅱ這樣的字符串也會被過濾掉。html 1. Unicode編碼 Unicode編碼是一種涵蓋了世界上全部語言、標點等字符的編碼方式,簡單一點說,就是一種通用的世界碼;其編碼範圍:U+0000 .. U+10FFFF。按Unicode硬編碼的區間進行劃分,Un
相關文章
相關標籤/搜索