selenium 爬取中國經濟社會發展數據庫數據 (3) 更新多地區 多關鍵字 多年爬取,優化關鍵字篩選方法

點贊發Naturehtml 初版在這web 第二版在這數據庫 此次更新了多地區,多時間段,多關鍵字爬取。 其實比較簡單,就是加了幾個循環語句。 稍微進行了一些關鍵字篩選方法優化,用的是dataframe.str.contains方法,而不是直接用==比較了 爲的是能夠進行大量數據爬取,測試了固定資產、GDP的爬取,是成功的。多線程 def find_table(indicator, region,
相關文章
相關標籤/搜索