簡單團隊-爬蟲豆瓣top250-項目總結

代碼託管平臺: https://gitee.com/w789369/PaChong/blob/master/test.py 1. 豆瓣抓站流程 分析url特徵 對需要抓取的數據設計正則表達式 處理HTML中一些特徵字符,換行符等 2. 實現的功能 簡單的實現了抓取豆瓣電影Top100的電影名稱 3. 後期工作展望 抓取更多的有用數據(如:準確抓取導演, 抓取一個電影評論) 使用多線程爬蟲 學習第三
相關文章
相關標籤/搜索