C10K問題

時間 2019-11-16

標籤 c10k 問題欄目 C&C++ 简体版

原文原文鏈接

開宗明義，epoll以及BSD的kqueue就是推出來解決 C10K的。Linux2.6 2003年左右。html

能夠看這篇文章node

http://www.oschina.net/translate/the-secret-to-10-million-concurrent-connections-the-kernel程序員

另外我以前的文章算法

http://www.cnblogs.com/charlesblc/p/6242479.htmlapache

也講到了百萬級別鏈接的要點 epoll的一些內部實現編程

還有這一篇：服務器

http://rango.swoole.com/archives/381swoole

Epoll就是爲了解決C10K問題而生。網絡

Nginx，libevent，node.js這些就是Epoll時代的產物。併發

當程序員還沉浸在解決C10K問題帶來的成就感時，一個新的問題被拋出了。異步嵌套回調太TM難寫了。

因而一個新的技術被提出來了，那就是協程（coroutine）。這個技術本質上也是異步非阻塞技術，它是將事件回調進行了包裝，讓程序員看不到裏面的事件循環。

程序員就像寫阻塞代碼同樣簡單。好比調用 client->recv() 等待接收數據時，就像阻塞代碼同樣寫。其實是底層庫在執行recv時悄悄保存了一個狀態，好比代碼行數，局部變量的值。而後就跳回到EventLoop中了。何時真的數據到來時，它再把剛纔保存的代碼行數，局部變量值取出來，又開始繼續執行。

這就是協程的本質。協程是異步非阻塞的另一種展示形式。Golang，Erlang，Lua協程都是這個模型。

注：我理解，就是把異步交給語言去處理；暴露的接口是同步形式的。

實際上同步阻塞程序的性能並不差，它的效率很高，不會浪費資源。當進程發生阻塞後，操做系統會將它掛起，不會分配CPU。直到數據到達纔會分配CPU。多進程只是開多了以後反作用太大，由於進程多了互相切換有開銷。因此若是一個服務器程序只有1000左右的併發鏈接，同步阻塞模式是最好的。

異步回調是沒有切換開銷的，它等同於順序執行代碼。因此異步回調程序的性能是要優於協程模型的。

這裏是指Nginx這種多進程異步非阻塞程序。Node.js/Redis此類程序若是不開多個進程，因爲沒法利用多核計算優點，因此性能並很差。

再看第三篇

C10K的問題——過去十年

十年前，工程師在處理C10K可擴展性問題時，都儘量的避免服務器處理超過10,000個的併發鏈接。經過修正操做系統內核以及用事件驅動型服務器（如Nginx和Node）替代線程式的服務器（如Apache）這個問題已經解決。從Apache轉移到可擴展的服務器上，人們用了十年的時間。在過去的幾年中，（咱們看到）可擴展服務器的採用率在大幅增加。

Apache的問題

Apache的問題是，（併發）鏈接數越多它的性能會越低下。
關鍵問題：（服務器的）性能和可擴展性並非一碼事。它們指的不是同一件事情。當人們談論規模的時候每每也會談起性能的事情，可是規模和性能是不可同日而語的。好比Apache。
在僅持續幾秒的短時鏈接時，好比快速事務處理，若是每秒要處理1,000個事務，那麼大約有1,000個併發鏈接到服務器。
若是事務增長到10秒，要保持每秒處理1,000個事務就必需要開啓10K（10,000個）的併發鏈接。這時Apache的性能就會陡降，即便拋開DDos攻擊。僅僅是大量的下載就會使Apache宕掉。
若是每秒須要處理的併發請求從5,000增長到10,000，你會怎麼作?假使你把升級硬件把處理器速度提高爲原來的兩倍。會是什麼狀況?你獲得了兩倍的性能，可是卻沒有獲得兩倍的處理規模。處理事務的規模或許僅僅提升到了每秒6,000個（即每秒6,000個併發請求）。繼續提升處理器速度，仍是無濟於事。甚至當性能提高到16倍時，併發鏈接數還不能達到10,000個。由此，性能和規模並非一回事。
問題在於Apache老是建立了一個進程而後又把它關閉了，這並非可擴展的。
爲何?由於內核採用的O(n^2) 算法致使服務器不能處理10,000個併發鏈接。
- 內核中的兩個基本問題：
  - 鏈接數 = 線程數/進程數。當一個包（數據包）來臨時，它（內核）會遍歷全部的10,000個進程以決定由哪一個進程處理這個包。
  - 鏈接數= 選擇數/輪詢次數（單線程狀況下）。一樣的擴展性問題。每一個包不得不遍歷一遍列表中的socket。
- 解決方法：修正內核在規定的時間內進行查找
  - 無論有多少線程，線程切換的時間都是恆定的
  - 使用一個新的可擴展的epoll()/IOCompletionPort在規定的時間內作socket查詢
因爲線程調度依然沒有被擴展，所以服務器對sockt大規模的採用epoll，致使須要使用異步編程模式，然而這正是Node和Nginx所採用的方式。這種軟件遷移會獲得（和原來）不同的表現（指從apache遷移到ngix等）。即便在一臺很慢（配置較低）的服務器上增長鏈接數性能也不會陡降。介於此，在開啓10K併發鏈接時，一臺筆記本電腦（運行ngix）的速度甚至超越了一臺16核的服務器（運行Apache）。

一個頗具影響的例子，就是在考慮到Apache的線程每一個鏈接模型（is to consider Apache’s thread per connection model）。這就意味着線程調度器根據到來的數據（on which data arrives）決定調用哪個（不一樣的）read()函數（方法）。把線程調度系統當作（數據）包調度系統來使用（我很是喜歡這一點，以前歷來沒據說過相似的觀點）。
Nginx宣稱，它並不把線程調度看成（數據）包調度來用使用，它自已作（進行）包調度。使用select來查找socket，咱們知道數據來了，因而就能夠當即讀取並處理它，數據也不會堵塞。
經驗：讓Unix處理網絡堆棧，以後的事情就由你自已來處理。

1. C10K問題2
2. C10K問題
3. C10K問題渣翻譯
4. 著名的C10K併發連接問題
5. ElasticSearch中碰到的C10K問題
6. 聊聊C10K問題及解決方案
7. c10k問題及其解決方案
8. C10K問題及解決方案
9. C10K問題和Libevent庫介紹
10. C10K
更多相關文章...
• Markdown 標題 - Markdown 教程
• jQuery Mobile 主題 - jQuery Mobile 教程
• PHP Ajax 跨域問題最佳解決方案
• IntelliJ IDEA中SpringBoot properties文件不能自動提示問題解決

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。