Node.js究竟是什麼

接觸前端也有一段時間了,逐漸開始接觸Node.js,剛剛接觸Node.js的時候一直都覺得Node.js就是JavaScript,當對Node.js有必定的瞭解以後,其實並否則二者之間有關係,其中的關係又不是必然的,對Node.js進行的一些瞭解,對其進行一些概述,本篇文章並無對Node.jsAPI進行講解,而是可以更加的明白Node.js是什麼。前端

到底什麼是Node.js

先看一下Node.js官網中是如何形容Node.js的,打開官網看到的第一句話就是Node.js® is a JavaScript runtime built on Chrome's V8 JavaScript engine.(Node.js是一個JavaScript運行時創建在Chrome的V8 JavaScript引擎。)在上面這段話中最重要的一點就是運行時node

到底什麼是運行時呢?其實在筆者看來運行時就是程序在運行時所須要的組件,能夠將其想象成爲是一種編程語言的運行環境。然而這個運行環境包含了代碼運行時所須要的解釋器和底層操做系統的支持等。程序員

文章開頭也說過Node.jsJavaScript之間有關係,可是其關係也不是必然,到這裏大概也就有點眉目了。對於任何語言來講,其中最終要的就是其解釋器如何去處理這些編程語言。Node.js的底層是使用C++實現的,然而語法則是遵循ECMAScript規範,其實徹底能夠把其實現換乘一種新的編程語言,更換語言的同時也就意味着其解釋器發生了翻天覆地的變化。編程

Node.js爲何要選擇JavaScript

到了這裏可能有些疑問,編程語言和解釋器有關係,那麼爲何要選擇了JavaScript然而不是其餘的語言呢?Node.js做者(Ryan Dahl)說,在創造Node.js的時,其目的是爲了實現高性能的Web服務器,其看重的並非JavaScript這門語言。可是他須要的事一種編程語言來實現其想法,這種編程語言不能帶有任何的IO功能,而且須要良好的支持事件機制。說到這裏感受就是在說JavaScript這門語言(感受就是天命之選,O(∩_∩)O哈哈~)。首先JavaScript徹底知足上述的兩個條件,然而就順其天然的JavaScript就成了Node.js的主導者。segmentfault

Runtime

上面一直提到的就是RuntimeRuntime是什麼?運行時刻是指一個程序在運行(cc或者在被執行)的狀態。也就是說,當你打開一個程序使它在電腦上運行的時候,那個程序就是處於運行時刻。在一些編程語言中,把某些能夠重用的程序或者實例打包或者重建成爲運行庫。這些實例能夠在它們運行的時候被連接或者被任何程序調用(節選自百度百科)。後端

其實對於開發者來講根本就不用去考慮其背後究竟是怎樣實現的,咱們站在開發的角度來想想,對於某一種語言的Runtime表示開發者能夠在Runtime上運行某種語言所編寫的代碼,若是把這個概念擴大一下說的話,Chorome也是一個JavaScript運行時依賴於背後的JavaScript引擎來運行JavaScript代碼而已。瀏覽器

其對應的Runtime能夠對其編程語言進行一些拓展,好比在Node.js中的fs、Buffer就是其對ECMAScript的拓展,Runtime並不包含整個ECMAScript中的所有特性。反過來說,就算一個特性沒有體如今標準裏,而大多數的運行時都支持它,也能夠變成實際上的規範。經過上述所說咱們能夠理解到對於任何語言來說咱們無需對其底層的實現,全部的東西都依賴於其運行時的實現而已,運行時環境對其支持狀況才能表現出其語言的特性。緩存

一樣的一段代碼可能在瀏覽器端能夠順利執行,可是放到Node.js中不必定能夠順利執行,反之也是同樣的,這樣的就足能夠說明上述問題了。服務器

Node.js內部機制

Node.js中有幾個很重要的關鍵詞單線程,非阻塞異步IO,在筆者剛剛接觸Node.js的時候,這幾個詞常常聽到,有些懵懵懂懂不是太能理解。爲了更好的瞭解其內部機制那麼針對這些東西進行說明。網絡

回調函數

爲何要說回調函數呢?對Node.js模塊有必定了解的話Node.js中模塊都是依賴於回調函數的,那麼什麼是回調函數呢?

回調函數就是一個經過函數指針調用的函數。若是你把函數的指針(地址)做爲參數傳遞給另外一個函數,當這個指針被用來調用其所指向的函數時,咱們就說這是回調函數。回調函數不是由該函數的實現方直接調用,而是在特定的事件或條件發生時由另外的一方調用的,用於對該事件或條件進行響應。(節選自百度百科)。

上面說了一堆套話,其實回調函數就是講一個函數做爲參數傳給另外一個函數做爲參數,而且該函數能夠被執行。回調方法和主線程處於同一個線程,假設主線程發起了一個底層的系統調用,操做系統會執行這個系統調用,當這個系統調用完成以後則會再回到主進程去執行後續的方法。

Node.js中在操做過程當中可能會有一個比較耗時的IO操做,當IO操做有了返回結果以後纔會繼續向下執行,其中在進行IO操做時就形成了代碼的阻塞,在Node.js最初設計的時候已經考慮到了這一點,因此提出了異步函數回調函數的方式,也能實現高併發的處理。對於前端來說Ajax就是一個異步回調函數,當發起請求時若是有後續代碼會先向下繼續執行,而不會等待期請求結果。

回調函數機制:

  1. 定義一個回調函數;
  2. 提供函數實現的一方在初始化的時候,將回調函數的函數指針註冊給調用者;
  3. 當特定的事件或條件發生的時候,調用者使用函數指針調用回調函數對事件進行處理。
同步/異步

有關於同步/異步也搜索了一些文獻,可是都是簡簡單單歸納一下,沒有細緻的說明。所謂同步和異步其描述的事進程和線程的調用方式。由於Node.js的單線程,所以同個時間只能處理同個任務,全部任務都須要排隊,前一個任務執行完,才能繼續執行下一個任務,可是,若是前一個任務的執行時間很長,好比文件的讀取操做或網絡請求,後一個任務就不得不等着,拿文件的讀取操做來講,當用戶向後臺讀取大量的文件時,不得不等到全部數據都讀取完畢才能進行下一步操做,後續程序只能在那裏乾等着,頗有可能形成響應超時。所以,Node.js在設計的時候,就已經考慮到這個問題,主線程能夠徹底不用等待文件的讀取完畢,能夠先掛起處於等待中的任務,先運行排在後面的任務,等到文件的讀取有告終果後,再回過頭執行掛起的任務,所以,任務就能夠分爲同步任務和異步任務。

  1. 同步任務:同步任務是指在主線程上排隊執行的任務,只有前一個任務執行完畢,才能繼續執行下一個任務,當咱們打開網站時,網站的渲染過程,好比元素的渲染,其實就是一個同步任務
  2. 異步任務:異步任務是指不進入主線程,而進入任務隊列的任務,只有任務隊列通知主線程,某個異步任務能夠執行了,該任務纔會進入主線程,當咱們打開網站時,像圖片的加載,音樂的加載,其實就是一個異步任務

上述所說同步調用指的是進程/線程發起調用後,一直等待調用結果返回後纔會繼續向下執行,可是對於Node.js來講雖然也是這樣,可是並不表明的CPU在這段時間內也會一直等待,操做系統多半會切換到另外一個進程/線程上等調用返回結果後在切回原有進程/線程。然而異步則偏偏相反,當發起異步調用時,進程/線程會繼續向下執行,當調用返回結果後經過某種技術手段通知其調用者已經有其結果。

咱們一直都在說的一句話就是JavaScript是一門異步語言,可是對於ECMAScript而言並無對異步有明確的規範,實際上是其解釋器(Node.js或瀏覽器)的runtime的其餘線程來實現的,這些並非JavaScript這門語言自己的功能。

對於異步請參考:淺析JavaScript異步

阻塞/非阻塞

筆者在沒有了解阻塞/非阻塞以前一直覺得同步/異步與阻塞/非阻塞之間是沒有區別的,然而現實就是這麼的打臉,阻塞/非阻塞和同步/異步徹底就是兩組概念,他們之間沒有任何的必然關係。不少人大概和我同樣同步=阻塞異步=非阻塞,這種概念是徹底不對的。

在瞭解阻塞與非阻塞以前首先要了解一下什麼是IO操做,IO操做實際上是內存與外部設備之間複製數據的過程。

在阻塞的狀況,是會一直等待直到write徹底部的數據再返回。這點行爲上與讀操做有所不一樣,究其緣由主要是讀數據的時候,一般剛開始咱們並不知道要讀的數據的長度,而是在數據的頭部設置了一個長度,在讀完指定長度的頭部後,才知道整個要讀的數據長度。若是一開始就貿然設置一個要讀的數據長度,而後像阻塞的write那樣去等讀完,則極可能會形成死循環;而對於write,因爲須要寫的長度是已知的,因此能夠一直再寫,直到寫完。不過問題是write是可能被打斷形成write一次只write一部分數據,因此write的過程仍是須要考慮循環write, 只不過多數狀況下一次write調用就可能成功。

非阻塞寫的狀況,是採用能夠寫多少就寫多少的策略。與讀不同的地方在於,有多少讀多少是由網絡發送端是否有數據傳輸到本地內核緩存爲準。可是對於能夠寫多少是由本地的網絡堵塞狀況爲標準的,在網絡阻塞嚴重的時候,網絡層沒有足夠的內存來進行寫操做,這時候就會出現寫不成功的狀況,阻塞狀況下會盡量(有可能被中斷)等待到數據所有發送完畢, 對於非阻塞的狀況就是一次寫多少算多少,沒有中斷的狀況下也仍是會出現write到一部分的狀況。

其實用一句話來講講的話,同步調用會形成進程的IO阻塞,而異步不會形成調用進程的IO阻塞。

單線程與多線程

Node.js並無提供多進程的支持,這表明在程序中所編寫的代碼只能運行在當前進程中,用於運行代碼的事件也是單線程進行的。開發者沒法在一個獨立進程中增長新的線程嗎,可是能夠派生出多個進程來達到必行完成任務。

進程

進程是指在操做系統中正在運行的一個應用程序

線程

線程是指進程內獨立執行某個任務的一個單元。線程本身基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程序計數器,一組寄存器和棧)。

對於Node.js,若是說JavaScript的函數式編程方式使得其異步編程的思想對程序員展示得更天然,那麼它背後的功臣Libuv,則爲異步編程的實現提供了可能。

1141038-20180307094514784-1056185595.png

上圖中從左往右分爲兩部分,一部分是與Network I/O相關的請求,而另一部分是由File I/O, DNS Ops以及User code組成的請求。

從圖中能夠看出,對於Network I/O和以File I/O爲表明的另外一類請求,異步處理的底層支撐機制是徹底不同的。 對於Network I/O相關的請求, 根據OS平臺不一樣,分別使用Linux上的epollOSXBSDOS上的kqueueSunOS上的event ports以及Windows上的IOCP機制。 而對於File I/O爲表明的請求,則使用thread pool。利用thread pool的方式實現異步請求處理,在各種OS上都能得到很好的支持。Libuv團隊爲何要選擇thread pool的機制。基本上緣由不外乎編碼和維護複雜度過高、可支持的API太少且質量堪憂、技術支持較弱,而用thread pool則很好地避開了這些問題。

Node.js的異步調用時由Libuv來支持的,以readFile爲例的話,讀取文件的系統調用是由Libuv來完成的,Node.js只負責調用Libuv所提供的接口就能夠了,等結果返回後在執行對應的回調方法。

並行與併發

自從Node.js出現後,JavaScript開始涉及後端領域,由於其出色的併發模型,被不少企業用來處理高併發請求。

與併發被同時說起到的還有並行,那麼並行與併發有有什麼區別?並行指在同一時間點同時執行,併發是指在同一時間片斷同時執行,上面已將解釋進程與線程,此時就可理解,進程之間相互獨立,可實現並行,但線程不能夠,多線程只能併發執行,實際仍是順執行,只是在同一時間片斷,假似同時執行,CPU能夠按時間切片執行,單核CPU同一個時刻只支持一個線程執行任務,多線程併發事實上就是多個線程排隊申請調用CPUCPU處理任務速度很是快,因此看上去多個線程任務說併發處理。

併發指的是一個CPU在不一樣線程來回跳,而後你會看到兩個線程搶奪CPU資源因此兩個線程輸出執行的順序不固定。

Node.js中的併發任務處理:

  1. 每一個Node.js進程只有一個主線程在執行程序代碼,造成一個執行棧。
  2. 主線程以外,還維護了一個"事件隊列"。當用戶的網絡請求或者其它的異步操做到來時,Node都會把它放到事件棧之中,此時並不會當即執行它,代碼也不會被阻塞,繼續往下走,直到主線程代碼執行完畢。
  3. 主線程代碼執行完畢完成後,而後經過事件循環,也就是事件循環機制,開始到事件棧的開頭取出第一個事件,從線程池中分配一個線程去執行這個事件。

接下來繼續取出第二個事件,再從線程池中分配一個線程去執行,而後第三個,第四個。主線程不斷的檢查事件隊列中是否有未執行的事件,直到事件隊列中全部事件都執行完了。

此後每當有新的事件加入到事件隊列中,都會通知主線程按順序取出交EventLoop處理。當有事件執行完畢後,會通知主線程,主線程執行回調,線程歸還給線程池。

咱們所看到的Node.js單線程只是一個JavaScript主線程,本質上的異步操做仍是由線程池完成的,Node.js將全部的阻塞操做都交給了內部的線程池去實現,自己只負責不斷的往返調度,並無進行真正的I/O操做,從而實現異步非阻塞I/O,這即是Node.js單線程和事件驅動的精髓之處了。

總結

讀完本篇文章應該對Node.js有了一個簡單的認識,其中提到的EventLoop在本文章並無進行解釋,有時間會對其進一步說明。Node.js完成了它提供高度可伸縮服務器的目標。它使用了Google的一個很是快速的JavaScript引擎,即V8引擎。它使用一個事件驅動設計來保持代碼最小且易於閱讀。全部這些因素促成了Node.js的理想目標,即編寫一個高度可伸縮的解決方案變得比較容易,其Node.js對於高併發的處理也有很好的支持,總之Node.js的強大之處還有不少仍然須要慢慢摸索。

文章中概念較多,你們能夠做理解,最後感謝你們用這麼長時間來閱讀這篇文章,文章中若是有什麼差錯請在評論處提出,我會盡快作出改正。

相關文章
相關標籤/搜索