自學Python1.5-Centos內python2識別中文

時間 2019-11-16

標籤自學 python1.5 python centos python2 識別中文欄目 Python 简体版

原文原文鏈接

自學Python之路html

自學Python1.5-Centos內python2識別中文

方法一，python推薦使用utf-8編碼方案

經驗一：在開頭聲明：python

# -*- coding: utf-8 -*-
固然，也能夠寫成：
# coding:utf-8ubuntu

經驗二：遇到字符（節）串，馬上轉化爲unicode，不要用str()，直接使用unicode()python2.7

unicode_str = unicode('中文', encoding='utf-8')
print unicode_str.encode('utf-8')測試

經驗三：若是對文件操做，打開文件的時候，最好用codecs.open，替代open(這個後面會講到，先放在這裏)import codecs編碼

codecs.open('filename', encoding='utf8')spa

經驗四：聲明字符串直接加u，聲明的字符串就是unicode編碼的字符串code

a = u"中"htm

經驗五：python在安裝時，默認的編碼是ascii，當程序中出現非ascii編碼時，python的處理經常會報這樣的錯blog

UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)，

python沒辦法處理非ascii編碼的，此時須要本身設置將python的默認編碼，通常設置爲utf8的編碼格式。

查詢系統默認編碼能夠在解釋器中輸入如下命令： Python代碼

>>>sys.getdefaultencoding()

設置默認編碼時使用： Python代碼

>>>sys.setdefaultencoding('utf8')

可能會報

的錯誤，執行reload(sys)，在執行以上命令就能夠順利經過。AttributeError: 'module' object has no attribute 'setdefaultencoding'

此時在執行sys.getdefaultencoding()就會發現編碼已經被設置爲utf8的了，可是在解釋器裏修改的編碼只能保證當次有效，在重啓解釋器後，會發現，編碼又被重置爲默認的ascii了，那麼有沒有辦法一次性修改程序或系統的默認編碼呢。

方法二：設置python的默認編碼

一個解決的方案在程序中加入如下代碼： Python代碼

import sys 
reload(sys) 
sys.setdefaultencoding('utf8')

另外一個方案是在/usr/local/lib/python.27/site-packages或者/usr/lib/python2.7下新建一個sitecustomize.py，內容爲： Python代碼，兩個路徑的緣由是由於系統不一樣的緣由，debian和ubuntu存放的目錄是後者，其餘沒有測試。

# encoding=utf8 

import sys   
reload(sys) 
sys.setdefaultencoding('utf8')

重啓python解釋器，執行sys.getdefaultencoding()，發現編碼已經被設置爲utf8的了，屢次重啓以後，效果相同，這是由於系統在python啓動的時候，自行調用該文件，設置系統的默認編碼，而不須要每次都手動的加上解決代碼，屬於一勞永逸的解決方法。

方法三：解決方案是在程序中全部涉及到編碼的地方，強制編碼爲utf8，即添加代碼encode("utf8")，這種方法並不推薦使用，由於一旦少寫一個地方，將會致使大量的錯誤報告.

........

1. python2.*中知識點
2. python2與python3的區別輸出中文
3. 中文識別 tesseractor
4. python2 python3區別
5. Python2中文亂碼處理
6. Django model.py 中文不識別
7. kaldi中文語音識別
8. tf15: 中文語音識別
9. 自學Python1.3-centos內python3並與python2共存
10. python2與python3區別
更多相關文章...
• R 繪圖 - 中文支持 - R 語言教程
• SQL 別名 - SQL 教程
• SpringBoot中properties文件不能自動提示解決方法
• Scala 中文亂碼解決

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

自學Python1.5-Centos內python2識別中文

自學Python1.5-Centos內python2識別中文

方法一，python推薦使用utf-8編碼方案

方法二 ：設置python的默認編碼

方法三：解決方案是在程序中全部涉及到編碼的地方，強制編碼爲utf8，即添加代碼encode("utf8")，這種方法並不推薦使用，由於一旦少寫一個地方，將會致使大量的錯誤報告.

方法二：設置python的默認編碼