統一資源標識符,用來惟一的標識一個資源
css
307 臨時重定向 請求的資源臨時從其餘位置響應。
400 錯誤請求 服務器沒法解析該請求。
401 未受權 請求沒有進行身份驗證或驗證未經過。
403 禁止訪問 服務器拒絕此請求。
404 未找到 服務器找不到請求的網頁。
405 方法禁用 服務器禁用了請求中指定的方法。
406 不接受 沒法使用請求的內容響應請求的網頁。
407 須要代理受權 請求者須要使用代理受權。
408 請求超時 服務器請求超時。html
HTML 定義了網頁的內容和結構, css 描述了網頁的佈局, JavaScript 定義了網頁的行爲 。正則表達式
HTML 定義了網頁的結構,可是隻有 HTML 頁面的佈局並不美觀,藉助CSS,頁面會變得更加美觀、優雅。數據庫
<!DOCTYPE html> # DOCTYPE 定義文檔類型 <html> # html標籤 <head> # 網頁頭:一些頁面的配置和引用 <meta charset="UTF-8"> # 網頁編碼:UTF-8 <title>This is a Demo</title> # 定義網頁標題 </ head> <body> # 網頁體:在網頁正文中顯示的內容 <div id=」container」> # div標籤:定義網頁中的區塊,它的id是container <div class="rapper」〉 # 它的class是wrapper <h2 class=」title」>Hello World</h2> # h2標籤:二級標題 <p class=」text」>Hell口, this i s a paragraph.</p> # p標籤:表明一個段落 </div> </div> </ body > </ html>
HTML DOM 將 HTML 文檔視做樹結構,這種結構被稱爲節點樹瀏覽器
網頁的內容是 HTML 代碼編寫的,文字、圖片等內容均經過寫好的 HTML 代碼來指定 , 這種頁面叫做靜態網頁安全
HTTP 的無狀態是指 HTTP 協議對事務處理是沒有記憶能力的,也就是說服務器不知道客戶端是什麼狀態 。服務器
其原本的含義是指善始善終的一系列動做/消息網絡
在 Web 中,會話對象用來存儲特定用戶會話所需的屬性及配置信息app
某些網站爲了辨別用戶身份 、 進行會話跟蹤而存儲在用戶本地終端上的數據佈局
Name、Value、Domain、MaxAge、Path、Size字段、HTTP 字段、Secure
會話 Cookie就是把 Cookie放在瀏覽器內存裏,瀏覽器在關閉以後該 Cookie 即失效 ; 持久 Cookie則會保存到客戶端的硬盤中,下次還能夠繼續使用,用於長久保持用戶登陸狀態
爬蟲爬取速度過快,在爬取過程當中可能遇到同一個 IP訪問過於頻繁的問題,此時網站就會讓咱們輸入驗證碼登陸或者直接封鎖IP。
使用代理隱藏真實的 IP,讓服務器誤覺得是代理服務器在請求向己。
在爬取過程當中經過不斷更換代理,就不會被封鎖,可 以達到很好的爬取效果。
FTP代理服務器、HTTP 代理服務器、SSL廳LS代理、RTSP 代理、Telnet代理、POP3/SMTP 代理、SOCKS 代理
高度匿名代理、普通匿名代理、透明代理、間諜代理
使用網上的免費代理、使用付費代理服務、ADSL 撥號