【python寫爬蟲】HTML網頁學習和Xpath網絡元素定位

計劃自行寫一個python爬蟲程序,需要了解以下兩個方面的內容: 1.HTML,瞭解網頁結構、內容,幫助後續數據讀取 2.HTTP協議,TCP/IP協議。瞭解網絡請求和網絡傳輸原理,幫助理解爬蟲的邏輯。 一、首先學習了HTML 1.分享鏈接:http://www.runoob.com/html/html-tutorial.html 這上面內容很全 2.着重看了HTML的元素和屬性,因爲讀取網頁內容
相關文章
相關標籤/搜索