wget使用小技巧php
簡單用法:
1.下載單個文件
如下的例子是從網絡下載一個文件並保存在當前目錄
wget http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
在下載的過程當中會顯示進度條,包含(下載完成百分比,已經下載的字節,當前下載速度,剩餘下載時間)。
html
2.以不一樣的文件名保存-O
wget默認會以最後一個符合」/」的後面的字符來命令,對於動態連接的下載一般文件名會不正確。
錯誤:下面的例子會下載一個文件並以名稱download.php?id=1080保存
即便下載的文件是zip格式,它仍然以download.php?id=1080命令。
正確:爲了解決這個問題,咱們可使用參數-O來指定一個文件名:
wget -O wordpress.zip http://www.centos.bz/download.php?id=1080
3.限速下載--limit-rate
當你執行wget的時候,它默認會佔用所有可能的寬帶下載。可是當你準備下載一個大文件,而你還須要下載其它文件時就有必要限速了。
wget --limit-rate=300k http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
4.斷點續傳-c
使用wget -c從新啓動下載中斷的文件:
wget -c http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
對於下載大文件時忽然因爲網絡等緣由中斷很是有幫助,咱們能夠繼續接着下載而不是從新下載一個文件。
python
5.後臺下載-b
對於下載很是大的文件,可使用參數-b進行後臺下載。
wget -b http://cn.wordpress.org/wordpress-3.1-zh_CN.zip
Continuing in background, pid 1840.
Output will be written to `wget-log'.
你可使用如下命令來察看下載進度
tail -f wget-log
6.假裝,代理下載
centos
a.user-agent假裝瀏覽器
有些網站能根據判斷代理名稱不是瀏覽器而拒絕你的下載請求。能夠經過--user-agent參數假裝。
wget --user-agent="Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.16 (KHTML, like Gecko) Chrome/10.0.648.204 Safari/534.16" URL
緩存
b.代理服務器
export proxy=http://192.168.0.254:8080cookie
wget -Y on -pk http://www.test.com/test.jpg網絡
7.測試下載連接--spider
當你打算進行定時下載,你應該在預約時間測試下載連接是否有效。能夠增長--spider參數進行檢查。
wget --spider URL
若是下載連接正確,將會顯示
wget --spider URL
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Remote file exists and could contain further links,
but recursion is disabled -- not retrieving.
這保證了下載能在預約的時間進行,但當你給錯了一個連接,將會顯示以下錯誤
wget --spider url
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 404 Not Found
Remote file does not exist -- broken link!!!
在如下幾種狀況下使用spider參數:
a.定時下載以前進行檢查
b.間隔檢測網站是否可用
c.檢查網站頁面的死連接
8.增長重試次數--tries
若是網絡有問題或下載一個大文件也有可能失敗。
wget --tries=3 URL
9.下載文件列表中的多個文件-i
首先,保存一份下載連接文件
cat > filelist.txt
url1
url2
url3
url4
接着使用這個文件和參數-i下載
wget -i filelist.txtapp
在LFS中這招蠻好用的噢!
10.鏡像網站--mirror
a.下載整個網站到本地
wget --mirror -p --convert-links -P /root/
--miror #鏡像下載
-p #下載全部顯示正常的文件
--convert-links #下載後,轉換成本地的連接
-P
b.下載url某個目錄中的全部文件
wget -r -np -nd
-r
-np
-nd
11.下載時過濾指定格式--reject
你想下載一個網站,但你不但願下載gif圖片,你可使用如下命令
wget --reject=gif url
你不但願下載信息直接顯示在終端而是在一個日誌文件,可使用如下命令:
wget -o download.log URL
13.限制總下載文件大小-Q
當你想要下載的文件超過5M而退出下載,你可使用如下命令:
wget -Q5m -i filelist.txt
注意:這個參數對單個文件下載不起做用,只能遞歸下載時纔有效。
14.下載指定格式文件-A
wget -r -A.pdf url
或者
wget -r -np -nd --acept=iso http://www.test.com/amd64
15.FTP下載
a.用戶名和密碼認證的ftp
wget --ftp-user=USERNAME --ftp-password=PASSWORD ftp://URL
或者wget --user=USERNAME --password=PASSWORD URL
後者ftp,http都適用。
b.使用通配符
wget ftp://www.test.com/pub/*
16.跳過非權威CA簽名的https網站
wget --tries=3 --no-check-certificate https://www.python.org/ftp/python/3.4.1/Python-3.4.1.tar.xz