啓動:
-V, --version 顯示 Wget 的版本信息並退出。
-h, --help 打印此幫助。
-b, --background 啓動後轉入後臺。
-e, --execute=COMMAND 運行一個「.wgetrc」風格的命令。
日誌和輸入文件:
-o, --output-file=FILE 將日誌信息寫入 FILE。
-a, --append-output=FILE 將信息添加至 FILE。
-d, --debug 打印大量調試信息。
-q, --quiet 安靜模式 (無信息輸出)。
-v, --verbose 詳盡的輸出 (此爲默認值)。
-nv, --no-verbose 關閉詳盡輸出,但不進入安靜模式。
--report-speed=TYPE Output bandwidth as TYPE. TYPE can be bits.
-i, --input-file=FILE 下載本地或外部 FILE 中的 URLs。
-F, --force-html 把輸入文件當成 HTML 文件。
-B, --base=URL 解析與 URL 相關的
HTML 輸入文件 (由 -i -F 選項指定)。
--config=FILE Specify config file to use.
下載:
-t, --tries=NUMBER 設置重試次數爲 NUMBER (0 表明無限制)。
--retry-connrefused 即便拒絕鏈接也是重試。
-O, --output-document=FILE 將文檔寫入 FILE。
-nc, --no-clobber skip downloads that would download to
existing files (overwriting them).
-c, --continue 斷點續傳下載文件。
--progress=TYPE 選擇進度條類型。
-N, --timestamping 只獲取比本地文件新的文件。
--no-use-server-timestamps 不用服務器上的時間戳來設置本地文件。
-S, --server-response 打印服務器響應。
--spider 不下載任何文件。
-T, --timeout=SECONDS 將全部超時設爲 SECONDS 秒。
--dns-timeout=SECS 設置 DNS 查尋超時爲 SECS 秒。
--connect-timeout=SECS 設置鏈接超時爲 SECS 秒。
--read-timeout=SECS 設置讀取超時爲 SECS 秒。
-w, --wait=SECONDS 等待間隔爲 SECONDS 秒。
--waitretry=SECONDS 在獲取文件的重試期間等待 1..SECONDS 秒。
--random-wait 獲取多個文件時,每次隨機等待間隔
0.5*WAIT...1.5*WAIT 秒。
--no-proxy 禁止使用代理。
-Q, --quota=NUMBER 設置獲取配額爲 NUMBER 字節。
--bind-address=ADDRESS 綁定至本地主機上的 ADDRESS (主機名或是 IP)。
--limit-rate=RATE 限制下載速率爲 RATE。
--no-dns-cache 關閉 DNS 查尋緩存。
--restrict-file-names=OS 限定文件名中的字符爲 OS 容許的字符。
--ignore-case 匹配文件/目錄時忽略大小寫。
-4, --inet4-only 僅鏈接至 IPv4 地址。
-6, --inet6-only 僅鏈接至 IPv6 地址。
--prefer-family=FAMILY 首先鏈接至指定協議的地址
FAMILY 爲 IPv6,IPv4 或是 none。
--user=USER 將 ftp 和 http 的用戶名均設置爲 USER。
--password=PASS 將 ftp 和 http 的密碼均設置爲 PASS。
--ask-password 提示輸入密碼。
--no-iri 關閉 IRI 支持。
--local-encoding=ENC IRI (國際化資源標識符) 使用 ENC 做爲本地編碼。
--remote-encoding=ENC 使用 ENC 做爲默認遠程編碼。
--unlink remove file before clobber.
目錄:
-nd, --no-directories 不建立目錄。
-x, --force-directories 強制建立目錄。
-nH, --no-host-directories 不要建立主目錄。
--protocol-directories 在目錄中使用協議名稱。
-P, --directory-prefix=PREFIX 以 PREFIX/... 保存文件
--cut-dirs=NUMBER 忽略遠程目錄中 NUMBER 個目錄層。
HTTP 選項:
--http-user=USER 設置 http 用戶名爲 USER。
--http-password=PASS 設置 http 密碼爲 PASS。
--no-cache 不在服務器上緩存數據。
--default-page=NAME 改變默認頁
(默認頁一般是「index.html」)。
-E, --adjust-extension 以合適的擴展名保存 HTML/CSS 文檔。
--ignore-length 忽略頭部的‘Content-Length’區域。
--header=STRING 在頭部插入 STRING。
--max-redirect 每頁所容許的最大重定向。
--proxy-user=USER 使用 USER 做爲代理用戶名。
--proxy-password=PASS 使用 PASS 做爲代理密碼。
--referer=URL 在 HTTP 請求頭包含‘Referer: URL’。
--save-headers 將 HTTP 頭保存至文件。
-U, --user-agent=AGENT 標識爲 AGENT 而不是 Wget/VERSION。
--no-http-keep-alive 禁用 HTTP keep-alive (永久鏈接)。
--no-cookies 不使用 cookies。
--load-cookies=FILE 會話開始前從 FILE 中載入 cookies。
--save-cookies=FILE 會話結束後保存 cookies 至 FILE。
--keep-session-cookies 載入並保存會話 (非永久) cookies。
--post-data=STRING 使用 POST 方式;把 STRING 做爲數據發送。
--post-file=FILE 使用 POST 方式;發送 FILE 內容。
--content-disposition 當選中本地文件名時
容許 Content-Disposition 頭部 (尚在實驗)。
--content-on-error output the received content on server errors.
--auth-no-challenge 發送不含服務器詢問的首次等待
的基本 HTTP 驗證信息。
HTTPS (SSL/TLS) 選項:
--secure-protocol=PR choose secure protocol, one of auto, SSLv2,
SSLv3, TLSv1, TLSv1_1 and TLSv1_2.
--no-check-certificate 不要驗證服務器的證書。
--certificate=FILE 客戶端證書文件。
--certificate-type=TYPE 客戶端證書類型,PEM 或 DER。
--private-key=FILE 私鑰文件。
--private-key-type=TYPE 私鑰文件類型,PEM 或 DER。
--ca-certificate=FILE 帶有一組 CA 認證的文件。
--ca-directory=DIR 保存 CA 認證的哈希列表的目錄。
--random-file=FILE 帶有生成 SSL PRNG 的隨機數據的文件。
--egd-file=FILE 用於命名帶有隨機數據的 EGD 套接字的文件。
FTP 選項:
--ftp-user=USER 設置 ftp 用戶名爲 USER。
--ftp-password=PASS 設置 ftp 密碼爲 PASS。
--no-remove-listing 不要刪除‘.listing’文件。
--no-glob 不在 FTP 文件名中使用通配符展開。
--no-passive-ftp 禁用「passive」傳輸模式。
--preserve-permissions 保留遠程文件的權限。
--retr-symlinks 遞歸目錄時,獲取連接的文件 (而非目錄)。
WARC options:
--warc-file=FILENAME save request/response data to a .warc.gz file.
--warc-header=STRING insert STRING into the warcinfo record.
--warc-max-size=NUMBER set maximum size of WARC files to NUMBER.
--warc-cdx write CDX index files.
--warc-dedup=FILENAME do not store records listed in this CDX file.
--no-warc-compression do not compress WARC files with GZIP.
--no-warc-digests do not calculate SHA1 digests.
--no-warc-keep-log do not store the log file in a WARC record.
--warc-tempdir=DIRECTORY location for temporary files created by the
WARC writer.
遞歸下載:
-r, --recursive 指定遞歸下載。
-l, --level=NUMBER 最大遞歸深度 (inf 或 0 表明無限制,即所有下載)。
--delete-after 下載完成後刪除本地文件。
-k, --convert-links 讓下載獲得的 HTML 或 CSS 中的連接指向本地文件。
--backups=N before writing file X, rotate up to N backup files.
-K, --backup-converted 在轉換文件 X 前先將它備份爲 X.orig。
-m, --mirror -N -r -l inf --no-remove-listing 的縮寫形式。
-p, --page-requisites 下載全部用於顯示 HTML 頁面的圖片之類的元素。
--strict-comments 用嚴格方式 (SGML) 處理 HTML 註釋。
遞歸接受/拒絕:
-A, --accept=LIST 逗號分隔的可接受的擴展名列表。
-R, --reject=LIST 逗號分隔的要拒絕的擴展名列表。
--accept-regex=REGEX regex matching accepted URLs.
--reject-regex=REGEX regex matching rejected URLs.
--regex-type=TYPE regex type (posix|pcre).
-D, --domains=LIST 逗號分隔的可接受的域列表。
--exclude-domains=LIST 逗號分隔的要拒絕的域列表。
--follow-ftp 跟蹤 HTML 文檔中的 FTP 連接。
--follow-tags=LIST 逗號分隔的跟蹤的 HTML 標識列表。
--ignore-tags=LIST 逗號分隔的忽略的 HTML 標識列表。
-H, --span-hosts 遞歸時轉向外部主機。
-L, --relative 只跟蹤有關係的連接。
-I, --include-directories=LIST 容許目錄的列表。
--trust-server-names use the name specified by the redirection
url last component.
-X, --exclude-directories=LIST 排除目錄的列表。
-np, --no-parent 不追溯至父目錄。複製代碼
例如:爬取一個網站的資源html
cd /testFileName /*存放下載的資源目錄*/
wget -N --limit-rate=10m -nH -r -l 10 -b -o /root/wget.log -np -k -L xxx.xxx.com/xxx/複製代碼