Linux下載命令Wget用法簡介

wget是個強力方便的命令行方式下的下載工具。本文介紹了wget的基本用法。
網絡用戶有時候會碰到須要下載一批文檔的狀況,有時甚至須要把整個網站下載下來或製做網站的映像。在Windows下的用戶都比較熟悉
Teleport,
webzip等等網站下載工具,實際上Linux中也完萬可以作到這樣的功能,那就是利用wget工具。wget是個命令行工具,用來下載網絡文檔或
整個網站,他具有自動重試、斷點續傳、支持代理服務器等等強大的功能。他可以徹底替代ftp客戶端。wget是在Linux下研發的開放源代碼的軟件,做
者是 Hrvoje Niksic,後來被移植到包括Windows在內的各個平臺上。
wget雖然功能強大,可是使用起來仍是比較簡單的,基本的語法是:wget [參數列表] URL。下面就結合具體的例子來講明一下wget的用法。
一、下載整個http或ftp站點。
wget http://place.your.url/here
這個命令可以將http://place.your.url/here 首頁下載下來。使用-x會強制創建服務器上一模相同的目錄,假如使用-nd參數,那麼服務器上下載的任何內容都會加到本地當前目錄。
wget -r http://place.your.url/here
這個命令會按照遞歸的方法,下載服務器上任何的目錄和文檔,實質就是下載整個網站。這個命令必定要當心使用,由於在下載的時候,被下載網站指向的任何地址
一樣會被下載,所以,假如這個網站引用了其餘網站,那麼被引用的網站也會被下載下來!基於這個緣由,這個參數不經常使用。可以用-l
number參數來指定下載的層次。例如只下載兩層,那麼使用-l 2。
要是您想製做映像站點,那麼可以使用-m參數,例如:
wget -m http://place.your.url/here
這時wget會自動判斷合適的參數來製做映像站點。此時,wget會登陸到服務器上,讀入robots.txt並按robots.txt的規定來執行。
二、斷點續傳。
當文檔特別大或網絡特別慢的時候,每每一個文檔尚未下載完,鏈接就已被切斷,此時就須要斷點續傳。wget的斷點續傳是自動的,只須要使用-c參數,例如:
wget -c http://the.url.of/incomplete/file
使用斷點續傳須要服務器支持斷點續傳。-t參數表示重試次數,例如須要重試100次,那麼就寫-t 100,假如設成-t 0,那麼表示無窮次重試,直到鏈接成功。-T參數表示超時等待時間,例如-T 120,表示等待120秒鏈接不上就算超時。
三、批量下載。
假若有多個文檔須要下載,那麼可以生成一個文檔,把每一個文檔的URL寫一行,例如生成文檔download.txt,
而後用命令:
wget -i download.txt
這樣就會把download.txt裏面列出的每一個URL都下載下來。(假如列的是文檔就下載文檔,假如列的是網站,那麼下載首頁)
四、選擇性的下載。
可以指定讓wget只下載一類文檔,或不下載什麼文檔。例如:
wget -m --reject=gif http://target.web.site/subdirectory
表示下載http://target.web.site/subdirectory,可是忽略gif文檔。--accept=LIST 可以接受的文檔類型,--reject=LIST拒絕接受的文檔類型。
五、密碼和認證。
wget只能處理利用用戶名/密碼方式限制訪問的網站,可以利用兩個參數:
--http-user=USER配置HTTP用戶
--http-passwd=PASS配置HTTP密碼
對於須要證書作認證的網站,就只能利用其餘下載工具了,例如curl。
六、利用代理服務器進行下載。
假如用戶的網絡須要通過代理服務器,那麼可以讓wget經過代理服務器進行文檔的下載。此時須要在當前用戶的目錄下建立一個.wgetrc文檔。文檔中可以配置代理服務器:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
分別表示http的代理服務器和ftp的代理服務器。假如代理服務器須要密碼則使用:
--proxy-user=USER配置代理用戶
--proxy-passwd=PASS配置代理密碼
這兩個參數。
使用參數--proxy=on/off 使用或關閉代理。
wget更有不少有用的功能,須要用戶去挖掘。web

相關文章
相關標籤/搜索