當你訪問淘寶的時候,發生了什麼?

原文地址:當你訪問淘寶的時候,發生了什麼?面試

由於準備阿里的面試(這個問題之前在阿里的筆面試中出現過),因此把這個問題還翻出來複習了一下。太細節的地方背起來固然沒什麼意義,這裏我就整理每一步大概作了哪些事情以及涉及到阿里相關的那些技術。瀏覽器

1. 瀏覽器查詢DNS服務器

在瀏覽器中鍵入的只是網址,那麼瀏覽器要知道具體的服務器就要查詢DNS服務器,將www.taobao.com轉換成相應的IP地址。阿里旗下網站的每日訪問量巨大,不可能將全部訪問都解析到一個IP地址上,那麼這一步就涉及到阿里的負載均衡系統服務器

2. 產生PV,同時若是是獨立用戶那麼將產生UV

PV指的是Page View,頁面被刷新一次就記一次數。網絡

UV指的是User View,一個用戶訪問一次就記一次數,不管這個用戶訪問了多少個頁面或者刷新了多少遍,都只記一次UV。負載均衡

3. 從CDN中獲取素材

阿里旗下的網站——尤爲是淘寶和天貓——富文本素材衆多,那麼若是都從服務器上讀取的話,一來速度慢,二來對服務器的壓力也大。因此這一步就涉及到阿里的CDN與分佈式文件系統。阿里在全國創建了上百個CDN節點,CDN指的是內容分發網絡。分佈式

4. 搜索

這是不少上淘寶天貓要作的第一件事情,那麼阿里的後臺系統將搜索行爲分爲如下四個類型:網站

  • 瀏覽型
  • 查詢型
  • 對比型
  • 肯定型

針對不一樣的搜索類型,會出現不一樣的結果。這裏涉及到阿里的搜索引擎日誌系統搜索引擎中包含了天然語言處理中文分詞以及其餘技術。日誌系統是記載了用戶作出的各種行爲,好比查詢、交易、取消交易等等,這些都會被保存下來。搜索引擎

5. 交易快照

只要是進行過的交易都會記錄下來,不管商品的信息是否發生了改變。那麼保存這些信息是須要很是巨大的存儲代價的,那麼這一步就涉及到阿里的分佈式存儲系統,同時注意這些數據保存以前都是會進行壓縮的。.net

6. 數據傳輸

不管是日誌仍是交易信息,乘以阿里每日的交易量都是一個很大的數據,因此阿里還開發了本身的數據傳輸系統日誌

7. 雲梯

最後,你在阿里旗下的全部網站的全部行爲,都會被大規模數據挖掘系統雲梯進行分析,以求最大程度地還原和定位你這我的。

相關文章
相關標籤/搜索