Java程序員,若是你想要搞明白CDN,這篇應該夠了!

程序員,若是想要搞明白CDN,這篇應該夠了!

最近在瞭解邊緣計算,發現咱們常常據說的CDN也是邊緣計算裏的一部分。那麼說到CDN,好像只知道它中文叫作內容分發網絡。那麼具體CDN的原理是什麼?可以爲用戶在瀏覽網站時帶來什麼好處呢?解決這兩個問題是本文的目的。javascript

CDN概念

CDN全稱叫作「Content Delivery Network」,中文叫內容分發網絡css

實際上CDN這個概念是在1996年由美國麻省理工學院的一個研究小組爲改善互聯網的服務質量而提出的。那麼它究竟是怎麼改善互聯網服務質量的呢?java

原理分析

咱們知道,當咱們使用域名訪問某一個網站時,實際上就是將請求包(以Http請求爲例)經過網絡傳輸給某臺服務器,好比訪問「www.baidu.com」時:程序員

  1. 首先解析出該域名所對應的IP地址(DNS域名解析)
  2. 而後將Http請求包經過網絡路由到IP地址所對應的服務器
咱們一般說「服務器的IP地址」,這其實不太準確,IP地址是和網卡綁定的,一個服務器能夠有多個網卡,也就是可能有多個IP地址。

咱們先來看第一步:域名解析數據庫

域名解析

解析域名分爲兩種:服務器

  1. 將一個域名解析爲一個IP地址
  2. 將一個域名解析爲另一個域名

其實解析思路不難,咱們在域名服務商購買了一個域名以後,須要去映射一個IP地址,能夠用Map來表示這個關係:{域名:IP}。網絡

同時咱們也能夠給某個域名取一個別名,好比「www.baidu.com」取一個別名「test.baidu.com」,這種關係也能夠用Map來表示:`{域名:別名}`。這裏的別名專業一點叫作**CNAME**,相信你們對這個詞有點眼熟,它就是這個意思。架構

域名解析,實際上就是解析出指定域名所對應的IP地址,或者該域名的一個CNAME。jsp

而域名解析是由DNS系統來負責的,DNS服務接受外部請求,從請求裏提取域名,性能

  • 若是這個域名對應的是IP地址,則返回這個IP地址,
  • 若是這個域名對應的是CNAME,則繼續查找CNAME域名的IP地址,而後將該地址返回給請求發送者。

請求發送者拿到IP地址以後,完成真正的請求調用。

實際上DNS系統是很是龐大的,這裏不去多將,你們把它看成一個黑盒子,這個盒子的做用就是上文所描述的,這裏用一個簡單的圖來表示一下。

沒有CNAME的狀況:

程序員,若是想要搞明白CDN,這篇應該夠了!

有CNAME的狀況:

程序員,若是想要搞明白CDN,這篇應該夠了!

特別注意:在有CNAME的狀況下,咱們能夠發現,CNAME實際上在域名解析的過程當中承擔了中間人(或者說代理)的角色,這是CDN實現的關鍵。

CDN原理

首先CDN是爲了改善互聯網的服務質量通俗一點說其實就是提升訪問速度。

假設百度網站如今只有一臺服務器,如今有一我的在上海訪問百度,若是該服務器也在上海,那麼一般來講訪問比較快,若是該服務器在拉薩,那麼相對而言訪問就比較慢了。那麼這個問題的根本緣由是網絡傳輸是依賴於網線的,網線越長,那麼時間確定就越久。

那麼怎麼解決這個問題呢?其實思路很簡單,百度在全國各地都部署如出一轍的服務器就好了,專業一點叫冗餘。

思路很簡單,但實現仍是比較麻煩的,服務器上的資源分爲兩種:靜態資源動態資源

  • 靜態資源:這種資源一般是不多變更的,好比圖片,視頻,css,javascript等等
  • 動態資源:這種資源不一樣用戶不一樣時刻訪問一般是不同的,好比ftl,jsp等等。

那麼若是百度要在全國各地都部署服務器,若是說每一個服務器上都有相同的動態資源,那麼可能還須要配置相應的數據庫,由於動態資源所記錄的信息一般會存儲在數據庫中,那麼這就涉及到了數據同步等等問題,這會致使成本很高,這種作法專業一點其實就是集羣,而目前來講集羣架構最可能是三地五中心,不是說全國多地集羣不可能,主要是成本過高。

你們想了解三地五中心的,能夠看 https://mp.weixin.qq.com/s/uG...,也是本人寫的。

那麼有沒有成本比較低的方式呢,有,就是在每一個服務器上只部署靜態資源,靜態資源一般不涉及到數據庫,因此成本也比較低,並且也能提升用戶的訪問速度。

到這裏,介紹了CDN想要達到的目的,那麼怎麼達到這個目的呢?

如今若是要比較CDN系統,咱們能夠考慮兩點:

  1. CDN系統中存儲靜態資源服務器的性能以及網速怎麼樣。
  2. CDN系統中全國甚至全球範圍內服務器節點的數量以及部署狀況。

第一點很好理解,第二點你們應該也能理解了,若是靜態資源的服務器節點不少,可以讓每一個用戶在訪問這些靜態資源時都不用「跑很遠的路程」才能獲取到,那麼天然這是CDN系統的優勢。

有公司看到了這種需求,因此如今其實有不少CDN供應商,好比阿里,騰訊等等都有本身的CDN服務。只要你本身的系統接入了這些大廠所提供的CDN服務,你把本身的靜態資源傳給CDN服務,那麼這些靜態資源將自動的分佈到全世界各地去。

好,那麼如今的問題是,用戶在訪問靜態資源時也是經過域名來訪問的,域名會被解析成某一個IP地址,關鍵的問題就是,DNS系統怎麼在作域名解析時,解析出來一個離用戶最近的一個IP地址呢

普通的DNS系統是作不到的,須要一個特殊的DNS服務器,這個特殊DNS須要知道

  1. 用戶當前所在位置
  2. 還須要知道用戶如今訪問的這個域名對應哪些IP地址,以及這個IP地址分別在哪?

對於第一個問題好解決,直接從用戶請求裏提取出用戶的ip地址,好比這個ip地址被解析爲北京電信、上海移動等等。

第二個問題由誰來解決,咱們如今考慮的是CDN,CDN提供商確定知道他們公司在哪些地方部署了機器以及它們的IP地址,因此這個問題只能有CDN提供商來解決,CDN提供商會提供這個特殊的DNS服務器,咱們叫作 CDN專用DNS服務器

這樣的話,只要用戶在使用某個域名訪問靜態資源時,若是用戶直接配置本身電腦的DNS地址爲CDN專用DNS服務器。那麼天然解決了問題,可是咱們須要考慮的時,咱們不能要求世界上全部的用戶都去修改本身電腦的DNS地址。因此這個時候就要利用DNS中的CNAME了。

用戶使用某個域名來訪問靜態資源時(這個域名在阿里CDN服務中叫作「加速域名」),好比這個域名爲「image.baidu.com」,它對應一個CNAME,叫作「cdn.ali.com」,那麼普通DNS服務器(區別CDN專用DNS服務器)在解析「image.baidu.com」時,會先解析成「cdn.ali.com」,普通DNS服務器發現該域名對應的也是一個DNS服務器,那麼會將域名解析工做轉交給該DNS服務器,該DNS服務器就是CDN專用DNS服務器。CDN專用DNS服務器對「cdn.ali.com」進行解析,而後依據服務器上記錄的全部CDN服務器地址信息,選出一個離用戶最近的一個CDN服務器地址,並返回給用戶,用戶便可訪問離本身最近的一臺CDN服務器了。

程序員,若是想要搞明白CDN,這篇應該夠了!

補充:

在對域名解析時有多種類型的記錄,最經常使用的好比:

  • A記錄:一個域名對應一個IP地址
  • CNAME:一個域名對應另一個域名
  • NS:將子域名指定其餘DNS服務器解析

程序員,若是想要搞明白CDN,這篇應該夠了!

總結

經過上面的文章咱們能夠發現,CDN的實現原理依賴於DNS,由於本人不是專門搞網絡的,因此文中若是有不許確的地方,還請各位大佬指出。

推薦閱讀

金三銀四季,阿里工做10多年Java大牛的「心得」,獻給迷茫中的你)

疫情之下,面對裁人潮,工做三年的Java程序員該何去何從?

相關文章
相關標籤/搜索