python | 爬蟲筆記 - 學習路線

時間 2019-11-21

標籤 python 爬蟲筆記學習路線欄目 Python 简体版

原文原文鏈接

整體學習路徑：

一、學習 Python 包並實現基本的爬蟲過程

二、瞭解非結構化數據的存儲

三、學習scrapy，搭建工程化爬蟲

四、學習數據庫知識，應對大規模數據存儲與提取

五、掌握各類技巧，應對特殊網站的反爬措施

六、分佈式爬蟲，實現大規模併發採集，提高效率

· 目標驅動

· 在一開始的時候，儘可能不要系統地去啃一些東西，找一個實際的項目（開始能夠從豆瓣、小豬這種簡單的入手），直接開始就好。

· 高效的姿式就是從實際的項目中去學習這些零散的知識點，你能保證每次學到的都是最須要的那部分。

參考： http://www.sohu.com/a/225904132_609569

##本系列內容爲《python3爬蟲開發實戰》學習筆記。本系列博客列表以下：html

（零）學習路線python

（一）開發環境配置數據庫

（二）爬蟲基礎併發

（三）基本庫使用scrapy

（四）解析庫使用分佈式

（五）數據存儲學習

（六）Ajax數據爬取網站

（七）動態渲染頁面爬取Seleniumui

持續更新...spa

對應代碼請見：..

相關文章

相關標籤/搜索

python爬蟲自學筆記

Python3 爬蟲學習筆記

python學習筆記

Python 學習筆記

Python爬蟲學習筆記12

Python爬蟲教學

Thymeleaf 教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<