unicode中漢字區間問題

今天接到一個優化性能的任務,把一個過濾非漢字字符的算法性能提高一下,原來方法使用瞭如下方法: if (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) 這個方法內部使用了一個二分查找的算法在一個100多個元素的數組中查找對應的UnicodeBlock,對於一個50K的html文件說,性能非常
相關文章
相關標籤/搜索