如何友好的把Python和Bash結合在一塊兒

對於Linux用戶而言,命令行操做咱們已經很是熟悉了。與其餘流行的操做系統不一樣,在Linux社區中,使用命令行與使用圖形用戶界面執行相似任務相比,命令行一般能夠提供更優雅,更有效的解決方案。python

如何友好的把Python和Bash結合在一塊兒

隨着Linux社區對命令行的依賴不斷增加,UNIX shell(如bash和zsh)已發展成爲極其強大的工具,能夠補充UNIX shell的經驗。使用bash和其餘相似的shell,可使用許多強大的功能,例如管道,文件名通配符以及從稱爲腳本的文件中讀取命令的功能。shell

讓咱們看一個真實的示例來演示命令行的功能。每次用戶登陸服務時,其用戶名都會記錄到一個文本文件中。對於此示例,讓咱們找出有多少惟一用戶使用該服務。編程

如下示例中的一系列命令經過將較小的構建塊連接在一塊兒,顯示了更復雜的實用工具的功能:bash

$ cat names.log | sort | uniq | wc -l

管道符號(|)用於將一個命令的標準輸出傳遞到下一命令的標準輸入。在此處的示例中,cat names.txt的輸出傳遞到sort命令中。sort命令的輸出是按字母順序從新排列文件的每一行。隨後將其傳遞給uniq命令,該命令將刪除全部重複的名稱。最後,uniq的輸出傳遞到wc命令。wc是計數命令,而且設置了-l標誌,它返回行數。這使您能夠將許多命令連接在一塊兒。數據結構

可是,有時所需的內容可能會變得很是複雜,而且將命令連接在一塊兒可能變得笨拙。在這種狀況下,shell腳本就是答案。Shell腳本是由Shell讀取並按順序執行的命令列表。Shell腳本還支持某些編程語言基礎知識,例如變量,流控制和數據結構。Shell腳本對於將常常重複運行的批處理做業很是有用。不幸的是,shell腳本有一些缺點:app

Shell腳本很容易變得過於複雜,而且對於想要改進或維護它們的開發人員來講是不可讀的。編程語言

這些shell腳本的語法和解釋器一般很笨拙且不直觀。語法越笨拙,對於必須使用這些腳本的開發人員來講,可讀性就越差。ide

該代碼一般沒法在其餘腳本中使用。腳本之間的代碼重用每每很困難,而且腳本每每很是特定於某個問題。模塊化

用於高級功能(例如HTML解析或HTTP請求)的庫不像現代編程和腳本語言那樣容易得到。工具

這些問題會使shell腳本難以處理,並常常致使大量開發人員時間浪費。取而代之的是,Python編程語言能夠用做很是有力的替代品。使用Python代替Shell腳本有不少好處:

默認狀況下,全部主要的Linux發行版都安裝了Python。打開命令行並當即鍵入python,將使您進入Python解釋器。這種廣泛性使它成爲大多數腳本任務的明智選擇。

Python具備很是易於閱讀和理解的語法。它的風格強調簡約和簡潔的代碼,同時容許開發人員以適合shell腳本的準系統風格進行編寫。

Python是一種解釋型語言,這意味着沒有編譯階段。這使Python成爲編寫腳本的理想語言,它容許您以解釋的方式快速嘗試新代碼。這使開發人員能夠快速修改,而沒必要將整個程序寫到文件中。

Python是一種功能齊全的編程語言。代碼重用很簡單,由於Python模塊能夠輕鬆導入並在任何Python腳本中使用。腳本能夠輕鬆擴展或構建。

Python可使用出色的標準庫和數以千計的第三方庫來處理各類高級實用程序,例如解析器和請求庫。例如,Python的標準庫包括日期時間庫,該庫容許將日期解析爲指定的任何格式並將其與其餘日期輕鬆比較。

但Python不該替換全部bash命令。編寫以UNIX方式運行的Python程序(即讀入標準輸入並寫入標準輸出)與爲現有的shell命令(如cat和sort)編寫Python替代品同樣強大。

讓咱們以本文前面已解決的問題爲基礎。除了已經完成的工做以外,讓咱們找出某個用戶已登陸系統的次數。uniq命令僅刪除重複項,但不提供有關有多少重複項的信息。代替uniq,Python腳本能夠用做鏈中的另外一個命令。這是一個執行此操做的Python程序(在個人示例中,我將此文件稱爲namescount.py):

#!/usr/bin/env python
import sys

if __name__ == "__main__":
    # Initialize a names dictionary as empty to start with.
    # Each key in this dictionary will be a name and the value
    # will be the number of times that name appears.
    names = {}
    # sys.stdin is a file object. All the same functions that
    # can be applied to a file object can be applied to sys.stdin.
    for name in sys.stdin.readlines():
            # Each line will have a newline on the end
            # that should be removed.
            name = name.strip()
            if name in names:
                    names[name] += 1
            else:
                    names[name] = 1

    # Iterating over the dictionary,
    # print name followed by a space followed by the
    # number of times it appeared.
    for name, count in names.iteritems():
            sys.stdout.write("%d\t%s\n" % (count, name))

讓咱們看看這個Python腳本如何適合命令鏈。首先,它從經過sys.stdin對象公開的標準輸入中讀取輸入。任何輸出都將寫入sys.stdout對象,這是在Python中實現標準輸出的方式。Python字典(在其餘語言中一般稱爲哈希映射)用於獲取從用戶名到重複計數的映射。要得到全部用戶的數量,請執行如下操做:

$ cat names.log | python namescount.py

顯示用戶出現的次數以及用戶名的計數。接下來要作的是按順序顯示最常使用該系統的用戶。這能夠在Python級別完成,可是讓咱們使用核心UNIX實用程序已經提供的實用程序來實現它。之前,我使用sort命令對字母進行排序。若是命令提供了-rn標誌,它將按降序對行進行數字排序。隨着Python腳本按標準輸出,只需將命令經過管道傳遞到sort並檢索所需的輸出:

$ cat names.log | python namescount.py | sort -rn

這是將Python用做命令鏈一部分的強大示例。在這種狀況下使用Python的優勢以下:

  • 與cat和sort等工具連接的能力。簡單的實用程序(逐行讀取文件並以數字方式對文件進行排序)由久經考驗的UNIX命令處理。這些命令也逐行讀取,這意味着這些功能能夠縮放到大型文件,並且速度很快。

  • 當須要在鏈中進行一些繁重的工做時,能夠編寫一個很是清晰,簡潔的Python腳本,該腳本將執行其所需的工做,而後將責任轉移給鏈中的下一個連接。

  • 它是一個可重用的模塊,儘管此示例專門針對名稱,可是若是您向此輸入中包含重複行的任何輸入,它將打印出每行和重複的數量。經過將Python代碼模塊化,能夠將其應用於各類場景。

爲了展現以模塊化和管道方式組合Python腳本的強大功能,讓咱們進一步把問題放大。讓咱們找到該服務的前五名用戶。head是一個命令,它容許您指定必定數量的行以顯示給定的標準輸入。將其添加到命令鏈中將獲得如下內容:

$ cat names.log | python namescount.py | sort -rn | head -n 5

這僅顯示前五個用戶,而忽略其他用戶。一樣,要使五個用戶最少使用該服務,可使用tail命令,該命令採用相同的參數。將Python命令打印到標準輸出的結果使能夠構建和擴展其功能。

以上就是簡單的介紹,實際中你們靈活運用就好。

原文來自:http://suo.im/5V4DNv

相關文章
相關標籤/搜索