WinHTTrack Website Copier使用說明html
WinHTTrack Website Copier能夠抓取整個網站或者某個網頁、某個論壇帖子。以抓取論壇某個主題帖子爲例:web
一、打開WinHTTrack Website Copier,下一步瀏覽器
二、工程名能夠以帖子標題命名,最好用英文,分類隨意,保存路徑建議非C盤。工具
三、咱們要下載若干個帖子,因此操做選擇下載個別文件,web地址能夠逐個輸入,也能夠用list列表,列表以回車鍵分開,對於有規律的帖子,能夠在excel中拖動快速造成。post
http://bbs.tianya.cn/post-399-70857-1.shtml網站
http://bbs.tianya.cn/post-399-70857-2.shtmlspa
http://bbs.tianya.cn/post-399-70857-3.shtml3d
四、選項,最大深度選擇1,最大外部連接深度選擇0。這樣咱們只搜索當前帖子或頁面所在的網址內容,不要外鏈到其餘網站,因此選擇0.這兩個選項很重要。excel
五、連接我選擇了試圖捕獲全部的URLs,保存全部指向非HTML文件的連接,例如外部的zip文件或圖片文件,首先保存HTML文件,取默認也行,沒看出多少區別。htm
六、構造取默認值便可。
七、搜尋頁面取默認值。
八、瀏覽器標緻取默認值。
九、肯定後直接開始。
10、特別要注意的是,新建一個工程要從新命名,不然會覆蓋原來的地址!
WinHTTrack Website Copier比Offline Explorer Portable(離線瀏覽器工具)的好處是抓取的文件很精準,沒有多餘的外鏈和文件,並且文件都是壓縮以後存儲的,佔用空間較小,並且文件數量很小。而Offline Explorer Portable搜索深度設置爲1的時候,會搜索本站點的外鏈,這不是我想要的,可是設置搜索深度爲0的話,又會出現附件沒有被下載的問題。
缺點是同一個站點的文件不能共用,須要再次下載,若是把列表放在一塊兒下載,之前下載的又會被覆蓋,而Offline Explorer Portable會更新之前下載的目錄,它是以站點爲單位進行下載的,網站有更新直接刷新下就行了。
WinHTTrack Website Copier還有個缺點是網址不支持變量,對於有規律的網址,須要藉助excel生成。而Offline Explorer Portable有網址宏功能,能夠自定義網址的起始頁,例如page=:{1..4}表明1~4頁。
WinHTTrack Website Copier和Offline Explorer Portable均可如下載論壇的附件(包括zip和jpg等類型的圖片附件),可是論壇的圖片不必定能正確抓取,網頁內嵌的圖片能夠正常抓取,緣由有待探索。
2018年10月9日