學習的爬蟲一點小感悟附上爬取淘寶信息的教程

       學習了一個月的爬蟲,對爬蟲的概念和思路有了一個基本瞭解,爬蟲的基本思路是:首先獲取網頁源碼,使用urllib,request庫等;而後對網頁源碼進行篩選出須要的信息,使用正則表達式,BeautifulSoup庫等,最經常使用的仍是正則表達式;其次就是存儲信息,能夠將信息存儲到excel表格,txt文件中,也能夠存儲到Mysql等數據庫中。在學習爬蟲的階段也是對python語言的一種更
相關文章
相關標籤/搜索