初識爬蟲之基本原理篇

在寫爬蟲之前,我們還需要了解一些基礎知識,如 HTTP 原理、網頁的基礎知識、爬蟲的基本原理 、 Cookies 的基本原理等。 HTTP基本原理 一個網站的圖標鏈接,它就是一個URL,也可以叫URI,但是我個人習慣於URL,而且在互聯網中URL也是比較常見的。 超文本 我們在瀏覽器裏看到的網頁就是超文本解析而成的, 其網頁源代碼是一系列 HTML 代碼, 裏面包含了一系列標籤,在網頁裏面的HTM
相關文章
相關標籤/搜索