爬蟲系列之一 基礎知識

 爬蟲是什麼?python 網絡爬蟲(又稱網頁蜘蛛,網絡機器人,在FOAF社區中間,更常常的稱爲網頁追逐者),是一個按照必定規則,自動的抓取萬維網信息的程序或者腳本。正則表達式   學習python爬蟲,須要學習並掌握如下幾點:shell Python基礎知識瀏覽器 Python中urllib和urllib2庫的用法緩存 Python正則表達式服務器 Python爬蟲框架Scrapy網絡 Py
相關文章
相關標籤/搜索