高併發是指在同一個時間點,有不少用戶同時的訪問URL地址,好比:淘寶的雙11,雙12,就會產生高併發,如貼吧的爆吧,就是惡意的高併發請求,也就是DDOS攻擊,再屌絲點的說法就像玩擼啊擼被ADC暴擊了同樣,那傷害你懂得(若是你看懂了,這個說法說明是正在奔向人生巔峯的屌絲。css
致使站點服務器/DB服務器資源被佔滿崩潰,數據的存儲和更新結果和理想的設計是不同的,好比:出現重複的數據記錄,屢次添加了用戶積分等。html
尼瑪,這麼卡,老子來參加活動的,刷新了仍是這樣,垃圾網站,不再來了。前端
在作公司產品網站的過程當中,常常會有這樣的需求,好比什麼搞個活動專題,抽獎,簽到,搞個積分競拍等等,若是沒有考慮到高併發下的數據處理,那就Game Over了,很容易致使抽獎被多抽走,簽到會發現一個用戶有多條記錄,簽到一次得到了得到了多積分,等等,各類超出正常邏輯的現象,這就是作產品網站必須考慮的問題,由於這些都是面向大量用戶的,而不是像作ERP管理系統,OA系統那樣,只是面向員工。node
下面我進行實例分析,簡單粗暴,動態分析,純屬本人我的經驗分享,若有說錯,或者有更好的建議或者意見的請留言,你們一塊兒成長。mysql
經過表設計,如:記錄表添加惟一約束,數據處理邏輯使用事物防止併發下的數據錯亂問題nginx
經過服務端鎖進程防止包併發下的數據錯亂問題web
這裏主要講述的是在併發請求下的數據邏輯處理的接口,如何保證數據的一致性和完整性,這裏的併發多是大量用戶發起的,也可能攻擊者經過併發工具發起的併發請求ajax
如例子:經過表設計防止併發致使數據錯亂redis
【簽到功能】 一天一個用戶只能簽到一次,
簽到成功後用戶獲取到一個積分sql
用戶表,包含積分字段
高併發意淫分析(屬於開發前的猜想):
在高併發的狀況下,會致使,一個用戶簽到記錄會有多條,或者用戶簽到後不止加一積分。
首先根據需求我會添加一張簽到記錄表,重點來了,這張表須要把用戶惟一標識字段(ID,Token)和簽到日期字段添加爲惟一約束,或者惟一索引,這樣就能夠防止併發的時候插入重複用戶的簽到記錄。而後再程序代碼邏輯裏,先執行簽到數據的添加(這裏能夠防止併發,添加成功後再進行積分的添加,這樣就能夠防止重複的添加積分了。最後我仍是建議全部的數據操做都寫在一個sql事務裏面, 這樣在添加失敗,或者編輯用戶積分失敗的時候能夠回滾數據。
如例子2(事務+經過更新鎖 防止併發致使數據錯亂 或者事物+Update的鎖表機制)
【抽獎功能】 抽獎一次消耗一個積分 抽獎中獎後編輯剩餘獎品總數 剩餘獎品總數爲0,或者用戶積分爲0的時候沒法進行抽獎
用戶表,包含積分字段 獎品表,包含獎品剩餘數量字段
在高併發的狀況下,會致使用戶參與抽獎的時候積分被扣除,而獎品實際上已經被抽完了
在事物裏,經過WITH (UPDLOCK) 鎖住商品表,或者Update 表的獎品剩餘數量和最後編輯時間字段,來把數據行鎖住,而後進行用戶積分的消耗,都完成後提交事物,失敗就回滾。 這樣就能夠保證,只有可能存在一個操做在操做這件商品的數量,只有等到這個操做事物提交後,其餘的操做這個商品行的事物纔會繼續執行。
如例子3(經過程序代碼防止包併發下的數據錯亂問題)
【緩存數據到cache裏】, 當緩存不存在的時候,從數據庫中獲取並保存在cache裏,若是存在從cache裏獲取,天天10點必須更新一次,其餘時間點緩存兩個小時更新一次 到10點的時候,凡是打開頁面的用戶會自動刷新頁面
這裏有個邏輯用戶觸發緩存的更新,用戶刷新頁面,當緩存存在的時候,會取到最後一次緩存更新時間,若是當前時間大於十點,而且最後緩存時間是10點前,則會從數據庫中從新獲取數據保存到cache中。 還有客戶端頁面會在10點時候用js發起頁面的刷新,就是由於有這樣的邏輯,致使10點的時候有不少併發請求同時過來,而後就會致使不少的sql查詢操做,理想的邏輯是,只有一個請求會去數據庫獲取,其餘都是從緩存中獲取數據。(由於這個sql查詢很耗服務器性能,因此致使在10點的時候,忽然間數據庫服務器壓力暴增)
C#經過 (鎖)lock,在從數據讀取到緩存的那段代碼前面加上鎖,這樣在併發的狀況下只會有一個請求是從數據庫裏獲取數據,其餘都是從緩存中獲取。
這接口是給前端ajax使用,訪問量會很大,一頁面展現的時候就會有幾十件商品的展現,滾動條滾到到頁面顯示商品的時候就會請求接口進行展現數據的統計,每次翻頁又會加載幾十件
設想若是同時有1W個用戶同時在線訪問頁面,一個次拉動滾動條屏幕頁面展現10件商品,這樣就會有10W個請求過來,服務端須要把請求數據入庫。在實際線上環境可能還會超過這個請求量,若是不通過進行高併發設計處理,服務器分分鐘給跪了。
咱們經過nodejs寫了一個數據處理接口,把統計數據先存到redis的list裏。(使用nodejs寫接口的好處是,nodejs使用單線程異步事件機制,高併發處理能力強,不會由於數據邏輯處理問題致使服務器資源被佔用而致使服務器宕機) 而後再使用nodejs寫了一個腳本,腳本功能就是從redis裏出列數據保存到mysql數據庫中。這個腳本會一直運行,當redis沒有數據須要同步到數據庫中的時候,sleep,讓在進行數據同步操做
如下我所知道的:
業務從發展的初期到逐漸成熟,服務器架構也是從相對單一到集羣,再到分佈式服務。
一個能夠支持高併發的服務少不了好的服務器架構,須要有均衡負載,數據庫須要主從集羣,nosql緩存須要主從集羣,靜態文件須要上傳cdn,這些都是能讓業務程序流暢運行的強大後盾。
服務器這塊可能是須要運維人員來配合搭建,具體我就很少說了,點到爲止。
大體須要用到的服務器架構以下:
高併發相關的業務,須要進行併發的測試,經過大量的數據分析評估出整個架構能夠支撐的併發量。
測試高併發可使用第三方服務器或者本身測試服務器,利用測試工具進行併發請求測試,分析測試數據獲得能夠支撐併發數量的評估,這個能夠做爲一個預警參考,俗話說知己自彼百戰不殆。
第三方服務:
併發測試工具:
日用戶流量大,可是比較分散,偶爾會有用戶高聚的狀況;
場景: 用戶簽到,用戶中心,用戶訂單,等
服務器架構圖:
說明:
場景中的這些業務基本是用戶進入APP後會操做到的,除了活動日(618,雙11,等),這些業務的用戶量都不會高彙集,同時這些業務相關的表都是大數據表,業務可能是查詢操做,因此咱們須要減小用戶直接命中DB的查詢;優先查詢緩存,若是緩存不存在,再進行DB查詢,將查詢結果緩存起來。
更新用戶相關緩存須要分佈式存儲,好比使用用戶ID進行hash分組,把用戶分佈到不一樣的緩存中,這樣一個緩存集合的總量不會很大,不會影響查詢效率。
方案如:
以上例子是一個相對簡單的高併發架構,併發量不是很高的狀況能夠很好的支撐,可是隨着業務的壯大,用戶併發量增長,咱們的架構也會進行不斷的優化和演變,好比對業務進行服務化,每一個服務有本身的併發架構,本身的均衡服務器,分佈式數據庫,nosql主從集羣,如:用戶服務、訂單服務;
秒殺、秒搶等活動業務,用戶在瞬間涌入產生高併發請求
場景:定時領取紅包,等
服務器架構圖:
說明:
場景中的定時領取是一個高併發的業務,像秒殺活動用戶會在到點的時間涌入,DB瞬間就接受到一記暴擊,hold不住就會宕機,而後影響整個業務;
像這種不是隻有查詢的操做而且會有高併發的插入或者更新數據的業務,前面提到的通用方案就沒法支撐,併發的時候都是直接命中DB;
設計這塊業務的時候就會使用消息隊列的,能夠將參與用戶的信息添加到消息隊列中,而後再寫個多線程程序去消耗隊列,給隊列中的用戶發放紅包;
方案如:
附加:
經過消息隊列能夠作不少的服務。
如:定時短信發送服務,使用sset(sorted set),發送時間戳做爲排序依據,短信數據隊列根據時間升序,而後寫個程序定時循環去讀取sset隊列中的第一條,當前時間是否超過發送時間,若是超過就進行短信發送。
高併發請求鏈接緩存服務器超出服務器可以接收的請求鏈接量,部分用戶出現創建鏈接超時沒法讀取到數據的問題;
所以須要有個方案當高併發時候時候能夠減小命中緩存服務器;
這時候就出現了一級緩存的方案,一級緩存就是使用站點服務器緩存去存儲數據,注意只存儲部分請求量大的數據,而且緩存的數據量要控制,不能過度的使用站點服務器的內存而影響了站點應用程序的正常運行,一級緩存須要設置秒單位的過時時間,具體時間根據業務場景設定,目的是當有高併發請求的時候可讓數據的獲取命中到一級緩存,而不用鏈接緩存nosql數據服務器,減小nosql數據服務器的壓力
好比APP首屏商品數據接口,這些數據是公共的不會針對用戶自定義,並且這些數據不會頻繁的更新,像這種接口的請求量比較大就能夠加入一級緩存;
服務器架構圖:
合理的規範和使用nosql緩存數據庫,根據業務拆分緩存數據庫的集羣,這樣基本能夠很好支持業務,一級緩存畢竟是使用站點服務器緩存因此仍是要善用。
高併發請求數據不變化的狀況下若是能夠不請求本身的服務器獲取數據那就能夠減小服務器的資源壓力。
對於更新頻繁度不高,而且數據容許短期內的延遲,能夠經過數據靜態化成JSON,XML,HTML等數據文件上傳CDN,在拉取數據的時候優先到CDN拉取,若是沒有獲取到數據再從緩存,數據庫中獲取,當管理人員操做後臺編輯數據再從新生成靜態文件上傳同步到CDN,這樣在高併發的時候可使數據的獲取命中在CDN服務器上。
CDN節點同步有必定的延遲性,因此找一個靠譜的CDN服務器商也很重要