複雜爬蟲編寫心得

  1. 信息收集和網站地圖繪製比編程更重要。編程

  2. 瀏覽器訪問效率的最大值是爬蟲效率的最低值。api

  3. 永遠不要使用selenium,儘可能不要使用phantomjs瀏覽器

  4. 對於脾氣暴躁、技術能力強的網站,要讓爬蟲變的友善優化

  5. 複雜爬蟲不宜過分優化,越冗餘,維護成本越低。網站

  6. 儘可能使用api和手機端接口。接口

相關文章
相關標籤/搜索