scrapy 入門爬取新聞

爲文本分類實驗爬取數據集,要求一百萬,分類>10類。html

參考連接:http://litianyi.cc/technology/2015/12/01/text-classification-1/scrapy

文檔:https://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.htmlhtm

最基礎的爬取,實驗新浪科技大概3k+,騰訊科技5k+,一財5w+,就爬不動了。文檔

相關文章
相關標籤/搜索