python 爬蟲 搜狗詞庫

完整版代碼github地址:https://github.com/Monster2848/sougou_dic_spider 目標網站 下面有分類 點進 社會科學–金融保險分類 我們需要獲取的數據是 詞庫標題 和 詞庫文件地址 通過查看請求發現這個網頁並沒有被加密 直接get請求就可以獲得完整網頁 然後要做的就是找到 標題元素 和 立即下載元素 提取 內容 和 url 寫一下xpath 匹配規則
相關文章
相關標籤/搜索