Python的編碼格式對於初學者來講是很頭疼的一件事,不過若是接觸的多了,就會發現,只要在恰當的時候使用了剛好的編碼,就不會出現太多的問題。python
python 的編碼格式2.x 和3.x是不同的python3.x
2.x採用的默認編碼格式是:ascii編碼
3.x採用的默認編碼格式是:utf-8spa
咱們在新建一個python文件的時候,咱們會在第一行聲明文件採用的編碼格式,咱們會添加utf-8的編碼格式:code
# -*- coding: UTF-8 -*-
或者
# coding:utf-8對象
上述兩種方式是等價的。blog
在Python2.x中,處理中文轉碼時候,咱們須要將默認編碼格式設置成utf-8,python3.x是不須要設置的,由於系統默認編碼格式已是utf-8了utf-8
import sys reload(sys) sys.setdefaultencoding('utf-8')
Python中的轉碼使用encode()和decode()兩個方法:ci
若是要將一個utf-8或者是gbk的字符串解碼成unicode對象,咱們須要使用decode():unicode
str = '人生苦短,我用python' 這是一個utf-8格式的中文字符串
unicode_str = str.decode('utf-8') 這樣就解碼成了一個unicode的字符串
gbk_str = unicode_str.encode('gbk') 這樣,將unicode編碼的字符串轉化成gbk格式