編碼字符集與中文文本處理

不知道大家都開始上網課了沒,反正我是上了。這不,這兩天一臉懵逼的學了編碼字符集,上來寫點東西鞏固一下知識,要是有大佬能指點一下是再好不過了。。。 我就不介紹歷史啥的了,就寫一下自己這兩天學到的東西吧。 淺談一下自己對編碼方式的瞭解。unicode規定了幾乎所有文字的一個字符集,並給每個字符一個唯一的編碼,每個字符對應一個唯一的4字節編碼。4字節2^32大概能包含40多億個字符吧,是足夠的了。 其中
相關文章
相關標籤/搜索