最近,我在翻閱兩本比較新的 Python 書籍時,發現它們都犯了一個嚴重的低級錯誤!html
這兩本書分別是《Python編程:從入門到實踐》和《父與子的編程之旅》,它們都是暢銷書,都在 2020 年 10 月出了新版本,都使用 Python3.7+ 版本的語法。python
然而,在關於變量的命名規則部分,它們犯下了同樣的錯誤,即還在使用 Python2 時代的那套說辭,誤覺得命名僅僅支持「字母、數字和下劃線」的組合。git
事實上,Python3.x 已經支持全面 Unicode 編碼,好比支持使用中文做爲變量名。編程
>>> 姓名 ="Python貓" >>> print(f"我是{姓名},歡迎關注!") 我是Python貓,歡迎關注!
因爲我手頭上沒有其它樣本,因此,我不肯定有多少新版的書籍還在使用老的規則。可是,翻譯類的書籍大機率都會有這樣的問題,另外,有些不嚴謹的國內書籍,也可能由於借鑑了過期的材料而犯錯。編程語言
如此一來,恐怕有些新接觸 Python 的同窗,就會造成錯誤的認識。雖然這可能不會形成嚴重的問題,可是它終歸是一個應該避免並且很容易就能避免的問題。ide
所以,我以爲這個話題值得聊一聊。函數
在編程語言中有一個很常見的概念,即標識符(identifier),一般又會稱之爲名字(name),用於標識出變量、常量、函數、類、符號等實體的名字。編碼
在定義標識符時,有一些必需要考慮的基本規則:spa
對於第一個問題,大多數的編程語言在早期版本都遵循這條規則:標識符由字母、數字和下劃線組成,而且不能以數字爲開頭。 少數的編程語言有例外,還支持使用$、@、%等特殊符號(例如PHP、Ruby、Perl等等)。翻譯
Python 的早期版本,確切地說是 3.0 以前的版本,就遵循以上的命名規則。下面是官方文檔中的描述:
identifier ::= (letter|"_") (letter | digit | "_")* letter ::= lowercase | uppercase lowercase ::= "a"..."z" uppercase ::= "A"..."Z" digit ::= "0"..."9"
出處:https://docs.python.org/2.7/r...
可是,這條規則從 3.0 版本起,就被打破了。最新的官方文檔已經變成了這樣:
出處:https://docs.python.org/3/ref...
隨着互聯網的普及,各國語言進入了國際化的語境中,編程語言也與時俱進地增加了對國際化的訴求。
Unicode(譯做統一碼、萬國碼)編碼標準在 1994 年發佈,隨後逐步被主流的編程語言所接納。到目前爲止,至少有 73 種編程語言支持 Unicode 變量名(數據依據:https://rosettacode.org/wiki/...)。
2007 年,當 Python 正在設計劃時代的 3.0 版本時,官方也考慮了對 Unicode 編碼的支持,因而,誕生了重要的《PEP 3131 -- Supporting Non-ASCII Identifiers》。
出處:https://www.python.org/dev/pe...
事實上,除了咱們最關心的中文,Unicode 字符集還包含很是很是多的內容。
在對變量命名時,下面這些用法都是可行的(謹慎使用,如若被打,本貓概不負責……):
>>> ψ = 1 >>> Δ = 1 >>> ಠ_ಠ = "hello"
綜上所述,某些 Python 書籍中關於變量命名規則的內容已通過時了,不該該被其所誤導!
Python 3 做爲一門面向現代化/國際化的語言,對於 Unicode 編碼有很好的支持。至於該不應在項目中使用中文給標識符命名,那就是另外的問題啦……