Linux中cut,sort,uniq和wc的用法

時間 2019-12-12

標籤 linux cut sort uniq 用法欄目 Linux 简体版

原文原文鏈接

一.cut是一個選取命令，就是將一段數據通過分析，取出咱們想要的。通常來講，選取信息一般是針對「行」來進行分析的，並非整篇信息分析的。
1.語法格式爲：
cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file]
2.使用說明
cut 命令從文件的每一行剪切字節、字符和字段並將這些字節、字符和字段寫至標準輸出。
若是不指定 File 參數，cut 命令將讀取標準輸入。必須指定 -b、-c 或 -f 標誌之一。
3.主要參數
-b ：以字節爲單位進行分割。這些字節位置將忽略多字節字符邊界，除非也指定了 -n 標誌。
-c ：以字符爲單位進行分割。
-d ：自定義分隔符，默認爲製表符。
-f ：與-d一塊兒使用，指定顯示哪一個區域。spa

二.sort將文件的每一行做爲一個單位，相互比較，比較原則是從首字符向後，依次按ASCII碼值進行比較，最後將他們按升序輸出.
-u : 它的做用很簡單，就是在輸出行中去除重複行。
-r : sort默認的排序方式是升序，若是想改爲降序，就加個-r就搞定了。
-o : 把sort的標準輸出到原文件中去。
-n : 以數值來進行排序。
你有沒有遇到過10比2小的狀況。我反正遇到過。出現這種狀況是因爲排序程序將這些數字按字符來排序了，排序程序會先比較1和2，顯然1小，因此就將10放在2前面嘍。這個時候就要用到-n選項了。
-t : 指定分隔符
-k : 指定分隔符後，指定列數。
-f : 忽略大小寫排序

三.uniq命令能夠去除排序過的文件中的重複行，所以uniq常常和sort合用。也就是說，爲了使uniq起做用，全部的重複行必須是相鄰的。
-i ：忽略大小寫字符的不一樣；
-c ：進行計數，顯示文件中每行連續出現的次數。
-u ：只顯示惟一的行
-d : 顯示文件中連續重複出現的行。
注意：uniq一般和sort一塊兒使用，由於uniq去重的前提是重複的行必須是相鄰的，因此在使用時，先用sort進行排序，而後再使用uniq。file

四.wc統計文件裏面有多少單詞，多少行，多少字符。
-l ：僅列出行；
-w ：僅列出多少字(英文單字)；
-m ：多少字符；語法