主要是爲了作接口測試,試着本身寫爬蟲,因此學習一下HTML一些基礎的東西,方便用來解析網頁。學習內容主要來自菜鳥教程的HTML教程,W3school的HTMLhtml
超文本標記語言(英語:HyperText Markup Language,簡稱:HTML)是一種用於建立網頁的標準標記語言web
HTML是運行在瀏覽器上的,由瀏覽器來解析瀏覽器
對於中文網頁須要使用<meta charset="UTF-8">聲明編碼,不然會出現亂碼。有些瀏覽器(如 360 瀏覽器)會設置 GBK 爲默認編碼,則你須要設置爲 <meta charset="gbk">。網絡
HTML文檔的後綴名能夠用.htm和.html,兩種沒啥區別均可以用學習
HTML文檔也叫作web頁面測試
HTML標籤是由尖括號包圍的關鍵字,好比<HTML>編碼
HTML標籤一般是成對出現的,好比<b></b>spa
標籤中第一個叫作開始標籤,第二個叫作結束標籤,養成寫了開始標籤,直接寫結束標籤,再寫內容的習慣,否則容易遺漏htm
HTML元素和HTML標籤一般是一個意思,可是嚴格來講,一個HTML元素包含開始標籤和結束標籤,好比:<p>這是一個段落</p>教程
web瀏覽器是用於讀取HTML文件,並將其做爲網頁顯示。
瀏覽器並非直接顯示HTML標籤,使用標籤能夠決定如何展現HTML頁面的內容給用戶
下面是一個可視化的HTML頁面結構:
只有 <body> 區域 (白色部分) 纔會在瀏覽器中顯示。 |
從初期的網絡誕生,已經出現了不少HTML版本
使用<!DOCTYPE>聲明HTML的版本,瀏覽器才能正確顯示網頁內容,doctype聲明是不區分大小寫的
通用聲明
HTML5
<!DOCTYPE HTML>