分析一套源代碼的代碼規範和風格並討論如何改進優化代碼

        個人工程實踐課題是設計面向特定對象的搜索引擎。我在Github上找到了一套爬取今日頭條、網易、騰訊新聞創建的簡單搜索引擎。前端

        目錄結構、命名:

        其目錄以下圖所示:python

                                                             

    

 

 

 

 

 

 

 

 

 

        從目錄結構來看,data主要存放數據庫文件,web存放前端的一些內容。命名也算規範。web

        代碼規範、風格:

        截取其中一部分代碼以下圖:數據庫

 

 

        能夠看出,  代碼基本上是符合python的編程規範的,例如變量名和函數名均是小寫+下劃線的形式進行,類名使用駝峯命名法。至於接口,這個項目比較簡單,並無傳統意義上的接口,類之間也沒有繼承關係,方法都直接實現了。代碼的風格良好,縮進與空行使用得當,命名也易於解讀,代碼總體簡介明瞭,方便人的閱讀。編程

        列舉違背代碼通常原則,能夠改進的地方:

        以上圖爲例,在總體代碼風格良好的狀況下,缺乏註釋。註釋是利於別人讀懂代碼的重要工具,沒有註釋極可能讓別人甚至代碼的做者後來都沒法讀懂代碼,不利於代碼交流以及後期代碼的更正改進。另外,這套項目的目錄結構混亂不夠簡潔,命名也不夠明晰。編程語言

       總結同類編程語言或項目在代碼規範和風格的通常要求,總結以下:

 一 代碼編排編輯器

1 縮進。4個空格的縮進(編輯器均可以完成此功能),不要使用Tap,更不能混合使用Tap和空格。
每行最大長度79,換行可使用反斜槓,最好使用圓括號。換行點要在操做符的後邊敲回車。
3 類和top-level函數定義之間空兩行;類中的方法定義之間空一行;函數內邏輯無關段落之間空一行;其餘地方儘可能不要再空行。
函數

二 文檔編排工具

1 模塊內容的順序:模塊說明和docstring—import—globals&constants—其餘定義。其中import部分,又按標準、三方和本身編寫順序依次排放,之間空一行。
2 不要在一句import中多個庫,好比import os, sys不推薦。
3 若是採用from XX import XX引用庫,能夠省略‘module.’,都是可能出現命名衝突,這時就要採用import XX。搜索引擎

三 空格的使用

整體原則,避免沒必要要的空格。
1 各類右括號前不要加空格。
2 逗號、冒號、分號前不要加空格。
3 函數的左括號前不要加空格。如Func(1)。
4 序列的左括號前不要加空格。如list[2]。
5 操做符左右各加一個空格,不要爲了對齊增長空格。
6 函數默認參數的賦值符左右省略空格。
7 不要將多句語句寫在同一行,儘管使用‘;’容許。
8 if/for/while語句中,即便執行語句只有一句,也必須另起一行。

四 註釋

整體原則,錯誤的註釋不如沒有註釋。因此當一段代碼發生變化時,第一件事就是要修改註釋!
註釋必須使用英文,最好是完整的句子,首字母大寫,句後要有結束符,結束符後跟兩個空格,開始下一句。若是是短語,能夠省略結束符。
1 塊註釋,在一段代碼前增長的註釋。在‘#’後加一空格。段落之間以只有‘#’的行間隔。

2 行註釋,在一句代碼後加註釋。好比:x = x + 1 # Increment x
可是這種方式儘可能少使用。
3 避免無謂的註釋。

五 文檔描述

爲全部的共有模塊、函數、類、方法寫docstrings;非共有的沒有必要,可是能夠寫註釋(在def的下一行)。
2 若是docstring要換行,參考以下例子:

"""Return a foobang

Optional plotz says to frobnicate the bizbaz first.

"""

六 命名規範

整體原則,新編代碼必須按下面命名風格進行,現有庫的編碼儘可能保持風格。
1 儘可能單獨使用小寫字母‘l’,大寫字母‘O’等容易混淆的字母。
2 模塊命名儘可能短小,使用所有小寫的方式,可使用下劃線。
3 包命名儘可能短小,使用所有小寫的方式,不可使用下劃線。
4 類的命名使用CapWords的方式,模塊內部使用的類採用_CapWords的方式。
5 異常命名使用CapWords+Error後綴的方式。
6 全局變量儘可能只在模塊內有效,相似C語言中的static。實現方法有兩種,一是__all__機制;二是前綴一個下劃線。
7 函數命名使用所有小寫的方式,可使用下劃線。
8 常量命名使用所有大寫的方式,可使用下劃線。
9 類的屬性(方法和變量)命名使用所有小寫的方式,可使用下劃線。
9 類的屬性有3種做用域public、non-public和subclass API,能夠理解成C++中的public、private、protected,non-public屬性前,前綴一條下劃線。
11 類的屬性若與關鍵字名字衝突,後綴一下劃線,儘可能不要使用縮略等其餘方式。
12 爲避免與子類屬性命名衝突,在類的一些屬性前,前綴兩條下劃線。好比:類Foo中聲明__a,訪問時,只能經過Foo._Foo__a,避免歧義。若是子類也叫Foo,那就無能爲力了。
13 類的方法第一個參數必須是self,而靜態方法第一個參數必須是cls。

相關文章
相關標籤/搜索