有人說「互聯網中有50%以上的流量是爬蟲」,第一次聽這句話也許你會以爲這個說法實在太誇張了,怎麼可能爬蟲比用戶還多呢?畢竟會爬蟲的相對與不會爬蟲的簡直少之又少。css
可是不少爬蟲工程師或者反爬蟲工程師講了實話:50%?你在逗我?就這麼少的量?而後他舉出例子:html
某個公司的某個頁面的某個接口,每分鐘訪問量是1.2萬左右,這裏面有都少正經常使用戶呢?50%?60%?正確答案是:500個如下,那咱們來算算爬蟲佔比:(12000-500)/12000=95.8%前端
沒錯95.8%,這是一位反爬蟲工程師給出的爬蟲佔比!!! node
前面咱們介紹HTTP的時候,給你們講過是萬維網的發明者,互聯網之父計算機科學家蒂姆·伯納斯·李,在他最初的構想組成中就有:提出使用HTML超文本標記語言(Hypertext Markup Language)做爲建立網頁的標準。 jquery
下面咱們來看看HTML標準的發展歷史: 程序員
咱們常說的網頁就是HTML頁面,而構成HTML頁面的東西有不少,如:html標籤、數據、css樣式、js等,那咱們就主要講講如下這幾個組成部分。web
HTML標籤是構成HTML頁面的主要組成部分,咱們來看一個HTML實際例子:面試
<!--註冊頁-->
<html>
<!--網頁頭-->
<head>
<meta charset="utf-8" />
<title>註冊頁</title>
</head>
<!--網頁體-->
<body>
<!--表單標籤-->
<form action="/register" method="post">
<div>用戶名:<input type="text" name="username"/></div>
<div>性 別:
<input name="sex" type="radio" checked="checked"/>男
<input name="sex" type="radio" />女
</div>
<div>密 碼:<input type="text" name="password"/></div>
<br/>
<input type="submit" value="註冊" style="width:150px;" />
</form>
</body>
</html>
複製代碼
上面是一個很是簡陋的用戶註冊頁面(用於教學),用戶能夠輸入用戶名性別和密碼而後點註冊就提交到服務器,下面咱們來稍微講解如下這個頁面。ajax
其餘的HTML標籤豬哥就很少講,但願你們本身去網上學習。數據庫
在有些初級web工程師面試中,面試過程當中可能會讓你手寫一個用戶註冊功能,這裏豬哥給你們講講大概的流程:
互聯網主要起到了信息交流的做用,而網頁做爲主要的信息交換載體,標籤的主要做用就是包裹數據,讓數據可以以人類可視的方式展示。
尤爲是一些新聞網站,他們主要以展現新聞信息爲主,咱們以頭條網頁來說講:
那服務器是如何將數據與封裝到頁面中去的呢?
html標籤+數據構成了整個網頁的骨架,可是隻有數據和html標籤的網頁是奇醜無比的 層疊樣式表(英文全稱:Cascading Style Sheets 簡稱CSS)是一種用來表現HTML等文件樣式的計算機語言。css能夠定義html現實的樣式,能夠實現不少不一樣的效果、排版等等,html中全部的元素幾乎都須要css來管理樣式,並且如今愈來愈流行div+css搭配控制頁面排版和樣式,css主要經過三大選擇器來修飾html標籤。
沒有css的頁面將會是雜亂無章或缺乏美感的頁面,咱們以上面簡單的用戶主頁爲例子演示如何使用css以及css的功能。 效果:
css使頁面有了很好看的樣式,可是卻沒有很好的交互性,何爲交互性?就是用戶在使用產品時的瀏覽、點擊、切換使之方便、快捷、平滑都很合理,很友好。
而js(JavaScript)則是增長網頁的動態功能,它定義了網頁的行爲,提升用戶體驗。好比js能夠監控到用戶的點擊,滑動等動做,而後根據用戶的這些動做來作一些操做。
咱們仍是以上面簡單的用戶主頁爲例子,用js(或jquery)來實現用戶修改用戶名或者性別信息。 代碼:
上面只是給你們作了一個很是簡單的js效果,給零基礎的朋友演示js是什麼,有什麼功能,可是js的功能遠不止這些,如今的js已經在前端、後端以及app中佔據着重要的地位,固然還有使用在反爬蟲的js混淆。
因爲篇幅緣由,豬哥這裏只給你們演示一些很是基礎很是簡單的功能,若是想學習網頁的製做同窗們能夠本身去網上學習,這裏推薦一個學習網站:菜鳥教程,但願你們都學習一些前端知識,由於爬蟲的第一步就是分析網頁,而後再根據網頁數據是內嵌在html標籤中,仍是js動態加載,或者網站使用加密或混淆的反扒技術。當遇到反扒高手時,咱們就須要去仔仔細細的分析js,這也被稱爲解毒的過程(反扒工程師在代碼裏投毒)。因此爬蟲與反扒的鬥爭可謂其樂無窮!