醒醒！Python已經支持中文變量名啦！

時間 2021-01-14

標籤 html python git 編程編程語言 ide 函數編碼 spa 翻譯欄目 Python 简体版

原文原文鏈接

最近，我在翻閱兩本比較新的 Python 書籍時，發現它們都犯了一個嚴重的低級錯誤！html

這兩本書分別是《Python編程：從入門到實踐》和《父與子的編程之旅》，它們都是暢銷書，都在 2020 年 10 月出了新版本，都使用 Python3.7+ 版本的語法。python

然而，在關於變量的命名規則部分，它們犯下了同樣的錯誤，即還在使用 Python2 時代的那套說辭，誤覺得命名僅僅支持「字母、數字和下劃線」的組合。git

事實上，Python3.x 已經支持全面 Unicode 編碼，好比支持使用中文做爲變量名。編程

>>> 姓名 ="Python貓"
>>> print(f"我是{姓名}，歡迎關注！")
我是Python貓，歡迎關注！

因爲我手頭上沒有其它樣本，因此，我不肯定有多少新版的書籍還在使用老的規則。可是，翻譯類的書籍大機率都會有這樣的問題，另外，有些不嚴謹的國內書籍，也可能由於借鑑了過期的材料而犯錯。編程語言

如此一來，恐怕有些新接觸 Python 的同窗，就會造成錯誤的認識。雖然這可能不會形成嚴重的問題，可是它終歸是一個應該避免並且很容易就能避免的問題。ide

所以，我以爲這個話題值得聊一聊。函數

在編程語言中有一個很常見的概念，即標識符（identifier），一般又會稱之爲名字（name），用於標識出變量、常量、函數、類、符號等實體的名字。編碼

在定義標識符時，有一些必需要考慮的基本規則：spa

它能夠由哪些字符組成？
它是否區分大小寫？（即大小寫敏感）
它是否容許出現某些特殊的單詞？（即關鍵字/保留字）

對於第一個問題，大多數的編程語言在早期版本都遵循這條規則：標識符由字母、數字和下劃線組成，而且不能以數字爲開頭。 少數的編程語言有例外，還支持使用$、@、%等特殊符號（例如PHP、Ruby、Perl等等）。翻譯

Python 的早期版本，確切地說是 3.0 以前的版本，就遵循以上的命名規則。下面是官方文檔中的描述：

identifier ::=  (letter|"_") (letter | digit | "_")*
letter     ::=  lowercase | uppercase
lowercase  ::=  "a"..."z"
uppercase  ::=  "A"..."Z"
digit      ::=  "0"..."9"

出處：https://docs.python.org/2.7/r...

可是，這條規則從 3.0 版本起，就被打破了。最新的官方文檔已經變成了這樣：

出處：https://docs.python.org/3/ref...

隨着互聯網的普及，各國語言進入了國際化的語境中，編程語言也與時俱進地增加了對國際化的訴求。

Unicode（譯做統一碼、萬國碼）編碼標準在 1994 年發佈，隨後逐步被主流的編程語言所接納。到目前爲止，至少有 73 種編程語言支持 Unicode 變量名（數據依據：https://rosettacode.org/wiki/...）。

2007 年，當 Python 正在設計劃時代的 3.0 版本時，官方也考慮了對 Unicode 編碼的支持，因而，誕生了重要的《PEP 3131 -- Supporting Non-ASCII Identifiers》。

出處：https://www.python.org/dev/pe...

事實上，除了咱們最關心的中文，Unicode 字符集還包含很是很是多的內容。

在對變量命名時，下面這些用法都是可行的（謹慎使用，如若被打，本貓概不負責……）：

>>> ψ = 1
>>> Δ = 1
>>> ಠ_ಠ = "hello"

綜上所述，某些 Python 書籍中關於變量命名規則的內容已通過時了，不該該被其所誤導！

Python 3 做爲一門面向現代化/國際化的語言，對於 Unicode 編碼有很好的支持。至於該不應在項目中使用中文給標識符命名，那就是另外的問題啦……

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。