查找文本中出現頻率最高的單詞

前言:藉助|管道來執行多條語句linux

Find2More.sh腳本代碼爲:bash

#!/bin/bash
end=$1   #$1第一參數,出現頻率最高的單詞的前幾項
cat $2 | #$2第二參數,目標文件
 tr -cs "[a-z][A-Z]" "[\012*]" | #將文本文件該一行一個單詞的形式呈現
  tr A-Z a-z | #對單詞中的大寫轉換爲小寫
   sort | #對單詞進行排序              
    uniq -c | #對單詞的重複進行統計
     sort -k1nr -k2 | #按頻率排序,再按字母排序
       head -n"$end" #顯示前幾項排序

執行linux命令:file

chmod u+x Find2More.sh #在root狀態下添加執行權限權限

#執行Find2More.sh腳本,在filename文本中查找出現頻率最高的單詞的前5項統計

./Find2More.sh  5 filename腳本

相關文章
相關標籤/搜索