str字符和unicode字符的區別

實際情況是,beautifulsoup處理後的網頁,的確是utf-8的。而utf-8和unicode,本身就不相等。 首先,字符串分兩種,一種是str字符,一種是unicode字符。str字符,就是普通字符,某種編碼的字符,包括ANSI,GBK,UTF-8等,而Unicode就是原始的unicode,未經過encode編碼的unicode,而進過某種編碼,比如utf-8,gbk等編碼後的unico
相關文章
相關標籤/搜索