python爬蟲相關整理

 初級爬蟲工程師: Web前端的知識:HTML, CSS, JavaScript, DOM, DHTML, Ajax, jQuery,json等; 正則表達式,能提取正常一般網頁中想要的信息,比如某些特殊的文字,鏈接信息,知道什麼是懶惰,什麼是貪婪型的正則; 會使用re, BeautifulSoup,XPath等獲取一些DOM結構中的節點信息; 知道什麼是深度優先,廣度優先的抓取算法,及實踐中的使
相關文章
相關標籤/搜索