認識node核心模塊--全局對象及Cluster

原文地址在個人博客,轉載請註明出處,謝謝!javascript

node 模塊是node 完成強大功能的實現者。node 的核心模塊包括events、fs、buffer、stream、cluster、http、net、一些操做OS和工具模塊、全局對象等。本文將在node核心特性理解的基礎上進一步深刻探討node核心模塊的具體細節。本文主要探討的模塊有:全局對象global及其重要屬性、多進程cluster、events重要類EventEmitter、流Stream、文件系統fs、網絡http,還會介紹node框架express相關。html

概述

本文先來介紹全局對象global及其重要屬性、多進程cluster模塊。java

正文

node全局對象global

與瀏覽器對應的window同樣,在node中global是全局對象,在全局做用域定義的任何變量都會保存爲global的屬性,稱爲全局變量。下面是global一些重要的屬性:node

  • 模塊:modulerequireexportsgit

    這三個全局變量組成了node 的模塊定義和引入,是 commonJS 的實現。node將每一個文件視爲一個模塊,在執行到每一個模塊以前都會定義好上述三個變量,所以能夠直接使用。來看它們之間的協做:github

    // module1.js
    exports.fun = function(a,b) {
        return a + b;
    } //綁定在exports的屬性能夠被其餘模塊引入使用
    
    //module2.js
    var module1 = require('./module1')
    module1.fun(3,2)     //5複製代碼

    相關機制:shell

    • module 表示對這個模塊的引用,所以module 實際上不是全局的,而是每一個模塊本地的。module除了exports 還有其餘關於模塊的屬性,例如module.children
    • exports 實際上是module.exports的簡寫,表示這個模塊的輸出。有一點須要注意,對exports直接賦值exports = {...}並不會被輸出,由於exports事先已經被定義了,再次這樣賦值會被覆蓋,須要帶上module:module.exports = {...}
    • require 表示引入某個模塊,填寫模塊路徑便可,在node_modules裏面的模塊填寫名字便可,js文件能夠不用寫擴展名。

    另外,因爲V8引擎對ES6的不斷支持,node 中也能夠直接使用ES6的一些特性、例如promise、class等,ES6的模塊也被node 實驗性的引入而且是穩定的。詳情見nodejs中文網。能夠在node.green查看支持的特性express

  • 異步操做 setTimeout、setInterval、setImmediate、process.nextTick編程

    • setTimeout和setInterval跟瀏覽器端同樣,不一樣的是,node實現了setImmediate(目前瀏覽器端只有 IE實現了該方法)。它表示在 Node.js 事件循環的當前回合結束時要調用的函數,用來把一些須要長時間運行的操做放在一個回調函數裏,在node主線程完成後面的其餘語句後,就馬上執行這個回調函數,參數是一個函數和用做這個函數的參數,做用跟setTimeout(fn,0)差很少,都是至關於當即在事件隊列末尾插入一個事件,但也有差異。api

    • process.nextTick(fn,...args)表示在當前調用棧結束後,在下一個事件執行前調用回調函數。node 提供這個API是爲了把複雜耗時的任務放到最後去處理,以便優先執行簡單的任務。來看它們之間的比較:

      setTimeout(() => console.log("setTimeout0"),0)
      setImmediate(() => console.log("setImmediate"))
      process.nextTick(() => console.log("nextTick"))
      //輸出nextTick setTimeout0 setImmediate 或者 nextTick setImmediate setTimeout0複製代碼

      不管process.nextTick寫在什麼地方,它老是第一個輸出。不管setTimeout和setImmediate誰先誰後,均可能出現兩種結果,其中setTimeout(fn,0)先於setImmediate多一點。這是由於它們三個產生的事件推入到了不一樣的watcher(觀察者)中—— setTimeout推入到了定時器觀察者,setImmediate是check觀察者,而process.nextTick()是idle觀察者 ,而node主線程在事件循環時調用watcher 的順序通常是 idle觀察者 > check觀察者,idle觀察者 > 定時器觀察者,check 和定時器不分前後,但定時器先於check的機率大一點。

  • node進程: process

    process 是node對進程的表示,提供了操做進程的接口,能夠用process來提供進程有關信息,控制進程 。

    process提供的接口包括

    描述進程的一些狀態(事件):exit、beforeExit、uncaughtException、Signal

    進程退出返回的狀態碼:Uncaught Fatal Exception、Signal Exits、Unused等

    進程的相關信息:stdout、stderr、config、stdin、exitCode、pid(進程編號)等

    操做進程的方法:abort、chdir、cwd、kill(發送信號給進程)、exit、nextTick、getgid、setgid、uptime等

  • 其餘: console、__filename__dirname

    這些都是全局變量,能夠在任何地方引用

node 子進程:child_process模塊

一個進程只能利用一個CPU時間分片,爲了高效利用多核CPU,node 提供了能夠建立子進程(注意不是子線程)child_process模塊,來幫助主進程高效利用多核CPU完成其餘複雜的任務。之因此提供建立子進程而不是子線程的接口,是由於這讓咱們的程序狀態單一,不用在乎狀態同步、死鎖、上下文切換開銷等等多線程編程中的頭疼問題。這樣以來一個進程只有一個線程。雖然單線程也會帶來一些問題,如錯誤會引發整個應用退出等,但這都有了很好的解決方案。

建立子進程

node有三種建立子進程的接口:

  • exec / execFile: 這二者都會建立子進程來執行,執行的結果會存儲在Buffer中。不一樣的是前者建立一個shell進程來執行命令,後者直接建立一個進程用來執行可執行文件,所以前者適合用來執行shell命令而後獲取輸出,後者效率較高。這二者由於輸出的結果存儲在Buffer中,所以只適合輸出輕量的數據。
  • spawn:適合用於進程輸入、輸出數據量比較大的狀況,由於它支持以 stream 的形式輸入輸出,能夠用於任何命令。spawn的參數option有一個stdio配置項,用來配置子進程與父進程之間的IO通道,還有一個detached來配置子進程是否獨立運行,能夠建立常駐後臺進程。總之,給予了子進程更多的靈活性。
  • fork:fork 實際上是spawn的特例,它會建立一個V8實例,只能用來運行node.js程序,而且與上面兩種方法不一樣的是,fork會在父子進程間創建 IPC 通道,父子進程之間能夠互相收發消息——經過監聽 message 事件和調用 send 方法,就能夠在父子進程間進行通訊了。

父子進程通訊

首先,這三種API都返回ChildProcess實例,所以均可以經過訪問stdout屬性來獲得輸出,exec/execFile 接口還能夠在參數裏綁定回調函數拿到子進程的stdout 。

const { exec, execFile, spawn, fork } = require("child_process")

// exec/execFile 接口既能夠在參數裏綁定回調函數拿到輸出流,也能夠利用返回的ChildProcess實例
const exec_process = exec("node child_process.js", {}, (err, stdout, stderr) => {
    if (err) {
        console.log(err)
    } else if(stdout) {
        console.log(stdout)
    } else {
        console.log(stderr)
    }
})
exec_process.stdout.on('data',(data) => console.log(`${data}`))

// spawn 接口沒有回調函數,只能利用返回的ChildProcess實例綁定監聽數據函數拿到子進程的輸出
const spawn_process = spawn('node',['child_process'], {})
spawn_process.stdout.on('data', (data) => console.log(`${data}`))

//fork 也能夠利用返回的ChildProcess實例,注意配置項silent要設爲true
const fork_process = fork('child_process.js', [], {'silent': true})
fork_process.stdout.on('data' ,(data) => console.log(`${data}`))複製代碼

其次, fork返回的ChildProcess實例有一個額外的內置的通訊通道IPC,它容許消息在父進程和子進程之間來回傳遞。

// child_process.js
process.on('message', (data) => {
  console.log(`message from Parent: ${data}`);
})
setTimeout(() => {
  process.send('send from child');
}, 2000)

// parent.js
const { fork } = require("child_process")
const p = fork(
  'child_process.js', // 須要執行的腳本路徑
  [], // 傳遞的參數
  {}
)
p.on('message', data => {                      //監聽子進程消息
  console.log(`message from child: ${data}`)
})
p.send('send from parent')                     //發送消息給子進程複製代碼

集羣:Cluster 模塊

cluster模塊是對child_process模塊的進一步封裝,專用於解決單進程NodeJS Web服務器沒法充分利用多核CPU的問題。使用該模塊能夠簡化多進程服務器程序的開發,讓每一個核上運行一個工做進程,並統一經過主進程監聽端口和分發請求。 ——七天學會node.js

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;
console.log(numCPUs)

if (cluster.isMaster) {
  console.log(`主進程 ${process.pid} 正在運行`);

  // 衍生工做進程。
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();      // 調用了 child_process.fork()方法建立工做進程
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工做進程 ${worker.process.pid} 已退出`);
  });
} else {
  // 工做進程能夠共享任何 TCP 鏈接。
  // 在本例子中,共享的是一個 HTTP 服務器。
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end('你好世界\n');
  }).listen(8000);

  console.log(`工做進程 ${process.pid} 已啓動`);
}
console.log("WOW")

// 輸出(Mac OS)
4
主進程 55570 正在運行
WOW
4
工做進程 55571 已啓動
WOW
4
工做進程 55572 已啓動
WOW
4
工做進程 55573 已啓動
WOW
4
工做進程 55574 已啓動
WOW

//能夠看到 fork 是異步建立的,調用時請求建立進程並當即返回,系統建立好進程後會加入到事件隊列,執行到事件就調用回調函數,這個回調函數包括執行一遍這個文件複製代碼

cluster.fork()實際調用了child_process.fork(),所以創建了IPC通道與父進程通訊。它會建立一個進程並返回cluster.worker實例。建立的每一個進程之間都是獨立的,一個進程的開啓和關閉不影響其餘進程。只要有存活的進程,服務器就能夠繼續處理鏈接。

主進程負責監聽端口,接收新鏈接後會自動將鏈接循環(默認)分發給cluster.fork()建立的工做進程來幫忙處理,所以可使用cluster模塊來實現簡單的負載均衡。

注意

  • cluster.fork()返回cluster.worker實例可能會引發困惑,困惑的緣由把主進程和工做進程作了master和worker的區分,這裏不用這麼區分,既然主進程也是進程,那麼也能夠看做worker,調用cluster.fork().send(message)就能夠向子進程發送信息,一樣監聽信息也是cluster.fork().on('message', (data) => {...})
  • worker 和 process 都是相對的,若是當前執行進程是主進程就表明主進程,是工做進程就表明工做進程。
  • cluster表明整個集羣,也就是主進程和工做進程,隨着當前執行進程的變化,cluster的屬性也在變化。在cluster上面綁定的事件對每一個進程都起做用。cluster有一些API 是隻對於主進程或只對於工做進程的,例如只能在主進程而不能在工做進程中調用的:fork、cluster.workers等,只能在工做進程不能在主進程調用的:cluster.worker等。
  • 跟上面child_process模塊不同的是,cluster.fork()只有增長進程環境變量的參數(通常是不帶的),沒有要執行文件路徑的參數,所以像上面代碼那樣主進程作的事和工做進程作的事寫在同一文件(if-else語句裏)是合理的。
相關文章
相關標籤/搜索