Java文章的漢字個數、標點符號個數、總的字符個數

1.函數介紹 要實現文章的漢字個數、標點符號個數、總的字符個數的統計,首先研究如何判斷某個字符是不是漢字,小編研究了GBK的編碼表,發現: GBK中文部分採用雙字節編碼,總體範圍:8140-FEFE,分爲首碼和尾碼,首碼範圍:81-FE,尾碼範圍:40-FE。 進一步觀察發現漢字的範圍是(首碼81-A0,尾碼40-FE)、(首碼AA-AF,尾碼40-A0)、(首碼B0-F7,尾碼40-FE)、(首
相關文章
相關標籤/搜索