【中文編碼】使用Python處理中文時的文字編碼問題

0x00 正文 最近,在處理中文編碼的數據的時候,遇到了一些仍是使人頭疼的問題。 亂碼! 亂碼!! 亂碼!!! 稍微整理一下處理過程,順帶着記錄一下解決方案啥的……html 0x01 文本轉碼 最初,拿到不少GB2312(Simplify)編碼的HTML文件,稍微有點頭疼,由於在Shell裏打開一看,都是下面這樣奇怪的東西python <p><span style="font-family: ;
相關文章
相關標籤/搜索