一.cut是一個選取命令,就是將一段數據通過分析,取出咱們想要的。通常來講,選取信息一般是針對「行」來進行分析的,並非整篇信息分析的。
1.語法格式爲:
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
2.使用說明
cut 命令從文件的每一行剪切字節、字符和字段並將這些字節、字符和字段寫至標準輸出。
若是不指定 File 參數,cut 命令將讀取標準輸入。必須指定 -b、-c 或 -f 標誌之一。
3.主要參數
-b :以字節爲單位進行分割。這些字節位置將忽略多字節字符邊界,除非也指定了 -n 標誌。
-c :以字符爲單位進行分割。
-d :自定義分隔符,默認爲製表符。
-f :與-d一塊兒使用,指定顯示哪一個區域。spa
二.sort將文件的每一行做爲一個單位,相互比較,比較原則是從首字符向後,依次按ASCII碼值進行比較,最後將他們按升序輸出.
-u : 它的做用很簡單,就是在輸出行中去除重複行。
-r : sort默認的排序方式是升序,若是想改爲降序,就加個-r就搞定了。
-o : 把sort的標準輸出到原文件中去。
-n : 以數值來進行排序。
你有沒有遇到過10比2小的狀況。我反正遇到過。出現這種狀況是因爲排序程序將這些數字按字符來排序了,排序程序會先比較1和2,顯然1小,因此就將10放在2前面嘍。這個時候就要用到-n選項了。
-t : 指定分隔符
-k : 指定分隔符後,指定列數。
-f : 忽略大小寫排序
三.uniq命令能夠去除排序過的文件中的重複行,所以uniq常常和sort合用。也就是說,爲了使uniq起做用,全部的重複行必須是相鄰的。
-i :忽略大小寫字符的不一樣;
-c :進行計數,顯示文件中每行連續出現的次數。
-u :只顯示惟一的行
-d : 顯示文件中連續重複出現的行。
注意:uniq一般和sort一塊兒使用,由於uniq去重的前提是重複的行必須是相鄰的,因此在使用時,先用sort進行排序,而後再使用uniq。file
四.wc統計文件裏面有多少單詞,多少行,多少字符。
-l :僅列出行;
-w :僅列出多少字(英文單字);
-m :多少字符;語法