Python的編碼註釋# -*- coding:utf-8 -*-

若是要在python2的py文件裏面寫中文,則必需要添加一行聲明文件編碼的註釋,不然python2會默認使用ASCII編碼。html

# -*- coding:utf-8 -*-

問題就來了,爲何要如此聲明?
首先請參考python的 PEP
概要以下python

  1. 必須將編碼註釋放在第一行或者第二行正則表達式

  2. 可選格式有vim

    # coding=<encoding name> # -- coding: <encoding name> -- # vim: set fileencoding=<encoding name> :編輯器

可是再往下看,發現其實只要註釋裏面有coding 和對應的編碼就能夠了,例如編碼

# vim: set fileencoding=<encoding name> :

因此搞了半天對最標準的作法也有點糊塗了。
後來想了想,看了下VIM中對python的語法高亮文件,裏面把以下的正則表達式肯定爲編碼聲明.net

\%^.*\(\n.*\)\?#.*coding[:=]\s*[0-9A-Za-z-_.]\+.*$

對於這個正則有些有點看不懂,可是大體以下必須有coding:[編碼]或者coding=[編碼]才行,這個應該能夠視做爲標準的聲明方式吧。
可是爲何一般這種方式呢?設計

# -*- coding:utf-8 -*-

答案在PEP-0263裏面有所說起,那就是Emacs等編輯器使用這種方式進行編碼聲明。 話說PEP裏面不少東西都是很值得參考的畢竟能夠知道爲何程序這樣設計。unix

相關參考code

  1. PEP-0263
  2. vim語法文件編寫總結
  3. # -- coding: UTF-8 -- 這是個註釋嗎?
相關文章
相關標籤/搜索