linux經常使用的文本處理命令

1、grep 命令

命令說明:按行處理,輸出文件中包含搜索字符串的全部行。
格式:grep [options] ‘搜索字符串’ filename正則表達式

參數說明:工具

-a:在二進制文件中,以文本文件的方式搜索數據;spa

-c:計算找到「搜索字符串」的次數;unix

-i:忽略大小寫;排序

-n:輸出行號;字符串

-v:反向選擇;字符串處理

-E:擴展正則表達式it

2、cut命令

命令說明:按行處理,將一行消息的某段切出來。
格式:cut -d '分割字符' -f fields
           cut -c 字符範圍io

參數說明:ast

-d :後面接分隔符,與-f一塊兒使用

-f :依據-d的分隔字符將一段信息切割成數段,用-f取出第幾段的意思

-c:以字符的單位取出固定字符區間

範例:

3、sort命令

命令說明:將文本文件的內容按行排序。
格式:sort [-fbMnrtuk] [file or stdin]
參數說明:
-f:忽略大小寫;
-b:忽略最前面的空格;
-u:即uniq,重複行僅出現一次;
-M:以月份的名字來排序;
-n:使用「純數字」來排序;
-r:反向排序;
-t:分隔符,默認爲tab鍵;
-k:按指定字段排序;

範例:

4、uniq命令

命令說明:若是排序完成了,將重複的行僅顯示一次。注意,若文件未排序,該命令失效。
格式:uniq [-ic]
參數說明:
-i:忽略大小寫;
-c:統計每行重複的次數;

範例:

5、wc命令

命令說明:統計文本文件中有多少字,多少行,多少字符。
格式:wc [-lwm]
參數說明:
-l:僅顯示行數;
-w:僅顯示字數(英文單詞個數);
-m:字符數;

範例:

6、tee命令

命令說明:雙向重導向,從標準輸入讀取數據,輸出到屏幕上,同時保存成文件。
格式:tee [-a] file
參數說明:
-a:以累加的方式,將數據加入到file中。

範例:

7、tr命令

命令說明:單個字符的處理工具,能夠用於刪除字符、替換字符等基本功能。更復雜的字符串處理工具一般使用sed。
格式:tr [-ds] SET1....
參數說明:
-d:刪除,例如:cat file | tr -d '\r',至關於dos2unix命令所起的做用。
-s:替換連續重複的字符,例如:cat file | tr -s [0-9],若是某個數字連續出現,僅保留第一個。

範例:

8、col命令

命令說明:格式化顯示列。
格式:col [-x]
參數說明:
-x:將tab鍵轉換成對等的空格鍵;

-b : 在文字內有反斜槓(/)時,僅保留反斜槓最後接的那個字符

9、join命令

命令說明:處理兩個文件中有相同數據的行,將它們加在一塊兒。
格式:join [-ti12] file1 file2

參數說明:
-i:忽略大小寫;
-t:分隔符,默認爲空格符;
-1 m:指定file1用來比較的字段m,默認值爲1;
-2 n:指定file2用來比較的字段n,默認值爲1;

範例:

相同的字段會放在最前面,在後面不會再顯示。

10、paste命令

命令說明:比較兩個文件的數據關聯性,直接將「兩行貼在一塊兒」,中間以tab鍵隔開。
格式:paste [-d] file1 file2
參數說明:
-d:後面接分隔符,默認爲tab鍵。

-  :若是file部分寫爲-,表示來之標準輸入的數據的意思

範例:

11、expand命令

命令說明:將tab鍵轉換成空格鍵。
格式:expand [-t] file

參數說明:
-t n:後面能夠接一個數字n,一個tab鍵替換爲n個空格鍵,默認值爲8。

12、split命令

命令說明:將一個大文件拆分爲幾個小文件。
格式:split [-bl] fle 
參數說明:
-b:拆分的文件大小,可加單位,如b, k, m等;
-l:按行數進行拆分;

範例:

十3、xargs

命令說明:產生某個命令的參數。
格式:xargs [-0epn] command

參數說明:
-0:若是輸入的stdin含有特殊字符,如`,\,空格鍵等字符時,這個參數能夠將它還原成通常字符。這個參數能夠用於特殊狀態;
-e:這個是EOF(end of file)的意思。後面能夠接一個字符串,當xargs分析到這個字符串,就會中止繼續工做;
-p:在執行每一個命令的參數時,都會詢問用戶的意思;
-n:後面接次數,每次command命令執行時,要使用幾個參數的意思;

當xargs後面沒有跟任何命令時,默認是以echo來進行輸出。

範例:

十4、diff命令

命令說明:以「行」爲單位進行文件比較,通常用在ASCII純文本文件。 格式:diff [-bBi] file1 file2 參數: -b:忽略一行中有多個空白的差別; -B:忽略空白行的不一樣; -i:忽略大小寫;

相關文章
相關標籤/搜索