Heritrix研究筆記(一)

這個開源的Web爬蟲,Internet Archive在它的官方文檔中說只維護在linux下,我不想用那麼麻煩的bash shell去設置那些環境變量什麼的,所以還是偷點懶,自己寫個windows命令腳本來讓這個爬蟲在windows下面跑起來吧,現在就跟我來吧,呵呵。 要在Windows上讓Heritrix跑起來,下面三步就OK了: <!--[if !supportLists]-->1) <!--
相關文章
相關標籤/搜索