Shell編程之正則表達式——sort,uniq工具

sort概述

sort 是一個以行爲單位對文件內容進行排序的工具,也能夠根據不一樣的數據類型來排序。例如數據和字符的牌局就不同。sort 命令的語法爲「sort [選項] 參數」,其中經常使用的選項包括如下幾種。apache

-f:忽略大小寫;
-b:忽略每行前面的空格;
-M:按照月份進行排序;
-n:按照數字進行排序;
-r:反向排序;
-u:等同於 uniq,表示相同的數據僅顯示一行;
-t:指定分隔符,默認使用[Tab]鍵分隔;
-o <輸出文件>:將排序後的結果轉存至指定文件;
-k:指定排序區域。

示例1:將/etc/passwd 文件中的帳號進行排序

[root@localhost ~]# sort /etc/passwd
abrt:x:173:173::/etc/abrt:/sbin/nologin 
adm:x:3:4:adm:/var/adm:/sbin/nologin apache:x:48:48:Apache:/var/www:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
...

示例 2:將/etc/passwd 文件中第三列進行反向排序。

[root@localhost ~]# sort -t ':' -rk 3 /etc/passwd 
nobody:x:99:99:Nobody:/:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

示例3:將/etc/passwd 文件中第三列進行排序,並將輸出內容保存至user.txt 文件中。

[root@localhost ~]# sort -t ':' -k 3 /etc/passwd -o user.txt 
[root@localhost ~]# cat user.txt 
root:x:0:0:root:/root:/bin/bash 
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin

uniq工具概述

Uniq 工具在 Linux 系統中一般與 sort 命令結合使用,用於報告或者忽略文件中的重複行。具體的命令語法格式爲:uniq [選項] 參數。其中經常使用選項包括如下幾種。bash

-c:進行計數;
-d:僅顯示重複行;
-u:僅顯示出現一次的行;

示例 1:刪除 testfile 文件中的重複行。

[root@localhost ~]# cat testfile Linux 10
Linux 20
Linux 30
Linux 30
Linux 30
CentOS 6.5
CentOS 6.5
CentOS 6.5
CentOS 7.3
CentOS 7.3
CentOS 7.3
[root@localhost ~]# uniq testfile Linux 10
Linux 20
Linux 30
CentOS 6.5
CentOS 7.3

示例 2:刪除 testfile 文件中的重複行,並在行首顯示該行重複出現的次數。

[root@localhost ~]# uniq -c testfile 1 Linux 10
1 Linux 20
3 Linux 30
3 CentOS 6.5
3 CentOS 7.3

示例 3:查找 testfile 文件中的重複行。

[root@localhost ~]# uniq -d testfile Linux 30
CentOS 6.5
CentOS 7.3

sort能夠把不連續的去重

uniq只能去重連續的

謝謝閱讀!!!

相關文章
相關標籤/搜索