unicode中漢字區間問題

時間 2021-08-15

標籤算法 C++ C# HTML 欄目字符編碼简体版

原文原文鏈接

今天接到一個優化性能的任務，把一個過濾非漢字字符的算法性能提高一下，原來方法使用瞭如下方法： if (Character.UnicodeBlock.of(c) == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) 這個方法內部使用了一個二分查找的算法在一個100多個元素的數組中查找對應的UnicodeBlock，對於一個50K的html文件說，性能非常

>>阅读原文<<