若是要在python2的py文件裏面寫中文,則必需要添加一行聲明文件編碼的註釋,不然python2會默認使用ASCII編碼。html
# -*- coding:utf-8 -*-
問題就來了,爲何要如此聲明?
首先請參考python的 PEP
概要以下python
必須將編碼註釋放在第一行或者第二行正則表達式
可選格式有vim
# coding=<encoding name> # -- coding: <encoding name> -- # vim: set fileencoding=<encoding name> :編輯器
可是再往下看,發現其實只要註釋裏面有coding 和對應的編碼就能夠了,例如編碼
# vim: set fileencoding=<encoding name> :
因此搞了半天對最標準的作法也有點糊塗了。
後來想了想,看了下VIM中對python的語法高亮文件,裏面把以下的正則表達式肯定爲編碼聲明.net
\%^.*\(\n.*\)\?#.*coding[:=]\s*[0-9A-Za-z-_.]\+.*$
對於這個正則有些有點看不懂,可是大體以下必須有coding:[編碼]或者coding=[編碼]才行,這個應該能夠視做爲標準的聲明方式吧。
可是爲何一般這種方式呢?設計
# -*- coding:utf-8 -*-
答案在PEP-0263裏面有所說起,那就是Emacs等編輯器使用這種方式進行編碼聲明。 話說PEP裏面不少東西都是很值得參考的畢竟能夠知道爲何程序這樣設計。unix
相關參考code