(018)機器學習_python基礎學習筆記

1、計算機中的字符編碼問題 最早是ASCII編碼,美國人發明,所以只把127個字符進行編碼,只需要一個字節,字符A的編碼是65,字符z編碼是122。 中文字符顯然一個字節編碼不夠,且爲了不和ASCII衝突,制定GB2312編碼,至少需要兩個字節進行編碼。 那麼,世界上各種語言有各種語言的編碼,那麼在多語言混合的文本中,顯示會有亂碼。 所以,出現了Unicode編碼,通常使用兩個字節(生僻字符會用到
相關文章
相關標籤/搜索