Python爬取實習僧算法JD

以前作了一個爬蟲給本身的CSDN刷量,其實跟寫一個簡單的小爬蟲差很少。在公司裏,爬蟲通常都跟nlp相關的業務息息相關,此次先爬取一下實習僧網站上的算法JD,爲之後學習nlp相關的知識準備一下數據。前端 先在實習僧上搜索算法崗位,發現url有必定的規律性,後面的兩個字段k就是key,p就是page,而後這就解決了遍歷全部page的需求。 取得每一個page的url以後,咱們還須要知道這樣幾件事情:
相關文章
相關標籤/搜索