1. 下載 wget urlhtml
2. grep 正則匹配url
# grep root /etc/passwdspa
或者htm
# cat /etc/passwd | grep root blog
3 cut 提取各類各樣的數據get
cut -c5 顯示第五個字符awk
cut -c5-顯示第五個後面的字符下載
4.awk -F '分隔符' '{print $1}'grep
詳細:請參考http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.html數據