改善 Python 程序的 91 個建議

1.引論算法

建議1:理解Pythonic概念—-詳見Python中的《Python之禪》編程

建議2:編寫Pythonic代碼設計模式

  • 避免不規範代碼,好比只用大小寫區分變量、使用容易混淆的變量名、懼怕過長變量名等。有時候長的變量名會使代碼更加具備可讀性。
  • 深刻學習Python相關知識,好比語言特性、庫特性等,好比Python演變過程等。深刻學習一兩個業內公認的Pythonic的代碼庫,好比Flask等。

建議3:理解Python與C的不一樣之處,好比縮進與{},單引號雙引號,三元操做符,Switch-Case語句等。安全

建議4:在代碼中適當添加註釋性能優化

建議5:適當添加空行使代碼佈局更加合理數據結構

建議6:編寫函數的4個原則多線程

  • 函數設計要儘可能短小,嵌套層次不宜過深
  • 函數聲明應該作到合理、簡單、易用
  • 函數參數設計應該考慮向下兼容
  • 一個函數只作一件事,儘可能保證函數粒度的一致性

建議7:將常量集中在一個文件,且常量名儘可能使用全大寫字母編輯器

2.編程慣用法函數

建議8:利用assert語句來發現問題,但要注意,斷言assert會影響效率工具

建議9:數據交換值時不推薦使用臨時變量,而是直接a, b = b, a

建議10:充分利用惰性計算(Lazy evaluation)的特性,從而避免沒必要要的計算

建議11:理解枚舉替代實現的缺陷(最新版Python中已經加入了枚舉特性)

建議12:不推薦使用type來進行類型檢查,由於有些時候type的結果並不必定可靠。若是有需求,建議使用isinstance函數來代替

建議13:儘可能將變量轉化爲浮點類型後再作除法(Python3之後不用考慮)

建議14:警戒eval()函數的安全漏洞,有點相似於SQL注入

建議15:使用enumerate()同時獲取序列迭代的索引和值

建議16:分清==和is的適用場景,特別是在比較字符串等不可變類型變量時(詳見評論)

建議17:儘可能使用Unicode。在Python2中編碼是很讓人頭痛的一件事,但Python3就不用過多考慮了

Python學習羣:683380553,有大牛答疑,有資源共享!是一個很是不錯的交流基地!歡迎喜歡Python的小夥伴!

建議18:構建合理的包層次來管理Module

3.基礎用法

建議19:有節制的使用from…import語句,防止污染命名空間

建議20:優先使用absolute import來導入模塊(Python3中已經移除了relative import)

建議21:i+=1不等於++i,在Python中,++i前邊的加號僅表示正,不表示操做

建議22:習慣使用with自動關閉資源,特別是在文件讀寫中

建議23:使用else子句簡化循環(異常處理)

建議24:遵循異常處理的幾點基本原則

  • 注意異常的粒度,try塊中儘可能少寫代碼
  • 謹慎使用單獨的except語句,或except Exception語句,而是定位到具體異常
  • 注意異常捕獲的順序,在合適的層次處理異常
  • 使用更加友好的異常信息,遵照異常參數的規範

建議25:避免finally中可能發生的陷阱

建議26:深刻理解None,正確判斷對象是否爲空。Python中下列數據會判斷爲空:

  • 常量 None
  • 常量 False
  • 任何形式的數值類型零,如 0、0L、0.0、0j
  • 空的序列,如 "、()、[]
  • 空的字典,如 {}
  • 當用戶定義的類中定義了 nonzero() 和 len() 方法,而且該方法返回整數 0 或者布爾值 False 的時候。

建議27:鏈接字符串應優先使用join函數,而不是+操做

建議28:格式化字符串時儘可能使用.format函數,而不是%形式

建議29:區別對待可變對象和不可變對象,特別是做爲函數參數時

建議30:[], {}和():一致的容器初始化形式。使用列表解析可使代碼更清晰,同時效率更高

建議31:函數傳參數,既不是傳值也不是傳引用,而是傳對象或者說對象的引用

建議32:警戒默認參數潛在的問題,特別是當默認參數爲可變對象時

建議33:函數中慎用變長參數*args和**kargs

  • 使用過於靈活,在混合普通參數或者默認參數的狀況下,變長參數意味着這個函數的簽名
  • 夠清晰,存在多種調用方式。另外變長參數可能會破壞程序的健壯性。
  • 若是一個函數的參數列表很長,雖然能夠經過使用 *args 和 **kwargs 來簡化函數的定義,但這一般意味着這個函數能夠有更好的實現方式,應該被重構。
  • 可變長參數適合在下列狀況下使用:
  • 爲函數添加一個裝飾器
  • 若是參數的數目不肯定,能夠考慮使用變長參數。
  • 用來實現函數的多態或者在繼承狀況下子類須要調用父類的某些方法的時候

建議34:深刻理解str()和repr()的區別

  • 二者之間的目標不一樣:str主要面向客戶,其目的是可讀性,返回形式爲用戶友好性和可讀性都比較高的字符串形式;而repr是面向Python解釋器或者說Python開發人員,其目的是準確性,其返回值表示Python解釋器內部的定義
  • 在解釋器中直接輸入變量,默認調用repr函數,而print(var)默認調用str函數
  • repr函數的返回值通常能夠用eval函數來還原對象
  • 二者分別調用對象的內建函數__str__()和__repr__()

建議35:分清靜態方法staticmethod和類方法classmethod的使用場景

4.庫

建議36:掌握字符串的基本用法

建議37:按需選擇sort()和sorted()函數

  • sort()是列表在就地進行排序,因此不能排序元組等不可變類型。
  • sorted()能夠排序任意的可迭代類型,同時不改變原變量自己。

建議38:使用copy模塊深拷貝對象,區分淺拷貝(shallow copy)和深拷貝(deep copy)

建議39:使用Counter進行計數統計,Counter是字典類的子類,在collections模塊中

建議40:深刻掌握ConfigParse

建議41:使用argparse模塊處理命令行參數

建議42:使用pandas處理大型CSV文件

  • Python自己提供一個CSV文件處理模塊,並提供reader、writer等函數。
  • Pandas可提供分塊、合併處理等,適用於數據量大的狀況,且對二維數據操做更方便。

建議43:使用ElementTree解析XML

建議44:理解模塊pickle的優劣

  • 優點:接口簡單、各平臺通用、支持的數據類型普遍、擴展性強
  • 劣勢:不保證數據操做的原子性、存在安全問題、不一樣語言之間不兼容

建議45:序列化的另外一個選擇JSON模塊:load和dump操做

建議46:使用traceback獲取棧信息

建議47:使用logging記錄日誌信息

建議48:使用threading模塊編寫多線程程序

建議49:使用Queue模塊使多線程編程更安全

5.設計模式

建議50:利用模塊實現單例模式

建議51:用mixin模式讓程序更加靈活

建議52:用發佈-訂閱模式實現鬆耦合

建議53:用狀態模式美化代碼

6.內部機制

建議54:理解build-in對象

建議55: init ()不是構造方法,理解__new__()與它之間的區別

建議56:理解變量的查找機制,即做用域

  • 局部做用域
  • 全局做用域
  • 嵌套做用域
  • 內置做用域

建議57:爲何須要self參數

建議58:理解MRO(方法解析順序)與多繼承

建議59:理解描述符機制

建議60:區別__getattr__()與__getattribute__()方法之間的區別

建議61:使用更安全的property

建議62:掌握元類metaclass

建議63:熟悉Python對象協議

建議64:利用操做符重載實現中綴語法

建議65:熟悉Python的迭代器協議

建議66:熟悉Python的生成器

建議67:基於生成器的協程和greenlet,理解協程、多線程、多進程之間的區別

建議68:理解GIL的侷限性

建議69:對象的管理和垃圾回收

7.使用工具輔助項目開發

建議70:從PyPI安裝第三方包

建議71:使用pip和yolk安裝、管理包

建議72:作paster建立包

建議73:理解單元測試的概念

建議74:爲包編寫單元測試

建議75:利用測試驅動開發(TDD)提升代碼的可測性

建議76:使用Pylint檢查代碼風格

  • 代碼風格審查
  • 代碼錯誤檢查
  • 發現重複以及不合理的代碼,方便重構
  • 高度的可配置化和可定製化
  • 支持各類IDE和編輯器的集成
  • 可以基於Python代碼生成UML圖
  • 可以與Jenkins等持續集成工具相結合,支持自動代碼審查

建議77:進行高效的代碼審查

建議78:將包發佈到PyPI

8.性能剖析與優化

建議79:瞭解代碼優化的基本原則

建議80:藉助性能優化工具

建議81:利用cProfile定位性能瓶頸

建議82:使用memory_profiler和objgraph剖析內存使用

建議83:努力下降算法複雜度

建議84:掌握循環優化的基本技巧

  • 減小循環內部的計算
  • 將顯式循環改成隱式循環,固然這會犧牲代碼的可讀性
  • 在循環中儘可能引用局部變量
  • 關注內層嵌套循環

建議85:使用生成器提升效率

建議86:使用不一樣的數據結構優化性能

建議87:充分利用set的優點

建議88:使用multiprocessing模塊克服GIL缺陷

建議89:使用線程池提升效率

建議90:使用C/C++模塊擴展提升性能

建議91:使用Cythonb編寫擴展模塊

相關文章
相關標籤/搜索