在python2中的編碼

在python2中的編碼python

#_author:star#date:2019/10/29'''字符編碼:ASCII:只能存英文和拉丁字符,gb2312:只能6700中文,1980年gbk1.0:存了20000多字符,1995年gb18030:2000年,27000中文unicode:UTF_32一個字符佔4個字節unicode:UTF_16一個字符佔2個字節或兩個以上,65535unicode:UTF_8一個英文用ASCII來存,一箇中文佔3個字節(1)在 python2 中UTF-8先解碼到Unicode而後Unicode在編碼到GBK(2)在 python2 中GBK先解碼到Unicode而後Unicode在編碼到UTF—8(3)在 python3中的encode()和python2 中的encode()不一樣,python2裏的encode()只是單純的編碼。python3中的encode()在編碼的同時還要將其轉爲bytes類型,decode()在解碼的同時還要將bytes類型轉爲字符串'''s='特斯拉's_to_unicode=s.decode('UTF-8')#(1)在 python2 中UTF-8先解碼到Unicodeunicode_to_gbk=s_to_unicode.encode("gbk")#,而後Unicode在編碼到GBKprint(s)#utf-8 亂碼print('unicode:',s_to_unicode)#unicodeprint('gbk:',unicode_to_gbk)#gbkgbk_to_unicode=unicode_to_gbk.decode('gbk')unicode_to_utf8=gbk_to_unicode.encode('utf-8')print(gbk_to_unicode)print(unicode_to_utf8)
相關文章
相關標籤/搜索