從瀏覽器地址欄輸入url到顯示頁面的步驟(以HTTP爲例)
- 在瀏覽器地址欄輸入URL
- 瀏覽器查看緩存,若是請求資源在緩存中而且新鮮,跳轉到轉碼步驟
- 若是資源未緩存,發起新請求
- 若是已緩存,檢驗是否足夠新鮮,足夠新鮮直接提供給客戶端,不然與服務器進行驗證。
- 檢驗新鮮一般有兩個HTTP頭進行控制
Expires
和Cache-Control
:
- HTTP1.0提供Expires,值爲一個絕對時間表示緩存新鮮日期
- HTTP1.1增長了Cache-Control: max-age=,值爲以秒爲單位的最大新鮮時間
- 瀏覽器解析URL獲取協議,主機,端口,path
- 瀏覽器組裝一個HTTP(GET)請求報文
- 瀏覽器獲取主機ip地址,過程以下:
- 瀏覽器緩存
- 本機緩存
- hosts文件
- 路由器緩存
- ISP DNS緩存
- DNS遞歸查詢(可能存在負載均衡致使每次IP不同)
- 打開一個socket與目標IP地址,端口創建TCP連接,三次握手以下:
- 客戶端發送一個TCP的SYN=1,Seq=X的包到服務器端口
- 服務器發回SYN=1, ACK=X+1, Seq=Y的響應包
- 客戶端發送ACK=Y+1, Seq=Z
- TCP連接創建後發送HTTP請求
- 服務器接受請求並解析,將請求轉發到服務程序,如虛擬主機使用HTTP Host頭部判斷請求的服務程序
- 服務器檢查HTTP請求頭是否包含緩存驗證信息若是驗證緩存新鮮,返回304等對應狀態碼
- 處理程序讀取完整請求並準備HTTP響應,可能須要查詢數據庫等操做
- 服務器將響應報文經過TCP鏈接發送回瀏覽器
- 瀏覽器接收HTTP響應,而後根據狀況選擇關閉TCP鏈接或者保留重用,關閉TCP鏈接的四次握手以下:
- 主動方發送Fin=1, Ack=Z, Seq= X報文
- 被動方發送ACK=X+1, Seq=Z報文
- 被動方發送Fin=1, ACK=X, Seq=Y報文
- 主動方發送ACK=Y, Seq=X報文
- 瀏覽器檢查響應狀態嗎:是否爲1XX,3XX, 4XX, 5XX,這些狀況處理與2XX不一樣
- 若是資源可緩存,進行緩存
- 對響應進行解碼(例如gzip壓縮)
- 根據資源類型決定如何處理(假設資源爲HTML文檔)
- 解析HTML文檔,構件DOM樹,下載資源,構造CSSOM樹,執行js腳本,這些操做沒有嚴格的前後順序,如下分別解釋
- 構建DOM樹:
- Tokenizing:根據HTML規範將字符流解析爲標記
- Lexing:詞法分析將標記轉換爲對象並定義屬性和規則
- DOM construction:根據HTML標記關係將對象組成DOM樹
- 解析過程當中遇到圖片、樣式表、js文件,啓動下載
- 構建CSSOM樹:
- Tokenizing:字符流轉換爲標記流
- Node:根據標記建立節點
- CSSOM:節點建立CSSOM樹
- 根據DOM樹和CSSOM樹構建渲染樹:
- 從DOM樹的根節點遍歷全部可見節點,不可見節點包括:1)
script
,meta
這樣自己不可見的標籤。2)被css隱藏的節點,如display: none
- 對每個可見節點,找到恰當的CSSOM規則並應用
- 發佈可視節點的內容和計算樣式
- js解析以下:
- 瀏覽器建立Document對象並解析HTML,將解析到的元素和文本節點添加到文檔中,此時document.readystate爲loading
- HTML解析器遇到沒有async和defer的script時,將他們添加到文檔中,而後執行行內或外部腳本。這些腳本會同步執行,而且在腳本下載和執行時解析器會暫停。這樣就能夠用document.write()把文本插入到輸入流中。同步腳本常常簡單定義函數和註冊事件處理程序,他們能夠遍歷和操做script和他們以前的文檔內容
- 當解析器遇到設置了async屬性的script時,開始下載腳本並繼續解析文檔。腳本會在它下載完成後儘快執行,可是解析器不會停下來等它下載。異步腳本禁止使用document.write(),它們能夠訪問本身script和以前的文檔元素
- 當文檔完成解析,document.readState變成interactive
- 全部defer腳本會按照在文檔出現的順序執行,延遲腳本能訪問完整文檔樹,禁止使用document.write()
- 瀏覽器在Document對象上觸發DOMContentLoaded事件
- 此時文檔徹底解析完成,瀏覽器可能還在等待如圖片等內容加載,等這些內容完成載入而且全部異步腳本完成載入和執行,document.readState變爲complete,window觸發load事件
- 顯示頁面(HTML解析過程當中會逐步顯示頁面)
歡迎關注本站公眾號,獲取更多信息